【2024年5月14日讯】

OpenAI发布GPT-4o全新旗舰AI模型,能即时理解及回应语音、影像等多媒体输入形式;逐步向ChatGPT用户开放文字、图像、声音及视频功能;并推出桌面版ChatGPT。

ChatGPT

GPT-4o具备语音及多媒体输入输出能力,即时理解并回应用户,平均反应时间约320毫秒。涵盖50多种语言,可进行即时双语对话及翻译。相较前代API,速度提升两倍,使用价格成本减半。所有ChatGPT用户可免费使用GPT-4o文字及图像功能,付费用户更享5倍使用上限。

GPT-4o的“o”代表“全能”(omni);具备即时识别及解答线性方程式,亦能侦测用户情绪并做出适切回应;可即时翻译餐牌、了解菜肴背景并提供推荐。未来更支援语音对话和视频交流,如询问体育赛事规则。在语音识别及翻译方面较现有模型优胜,尤其支援低语言资源

GPT-4o文字及图像功能即时开放予所有用户使用,但免费用户使用上限较低。语音及视频功能将于未来数周内推出,仅限付费用户使用。OpenAI将陆续为免费用户开放GPT-4级别智能功能,涵盖网络资讯连接、数据分析和制图,以及文件总结、编写或分析。

OpenAI同时推出ChatGPT桌面版,首阶段只面向Mac用户,支援透过语音及画面直接与助手对话,付费订阅用户即可使用,Windows版则将稍后推出。有见及Google I/O开发者大会即将召开,业界认为OpenAI此举或有先发制人之意。至于Google人工智能Gemini的反应,将于未来数日揭晓。

伸延阅读

消息来源

 
突发新闻
这是一篇突发新闻报道。
文章内容可能随时修改。请引用可以用到的所有来源