【2024年5月14日讯】

OpenAI發佈GPT-4o全新旗艦AI模型,能即時理解及回應語音、影像等多媒體輸入形式;逐步向ChatGPT用戶開放文字、圖像、聲音及視頻功能;並推出桌面版ChatGPT。

ChatGPT

GPT-4o具備語音及多媒體輸入輸出能力,即時理解並回應用戶,平均反應時間約320毫秒。涵蓋50多種語言,可進行即時雙語對話及翻譯。相較前代API,速度提升兩倍,使用價格成本減半。所有ChatGPT用戶可免費使用GPT-4o文字及圖像功能,付費用戶更享5倍使用上限。

GPT-4o的「o」代表「全能」(omni);具備即時識別及解答線性方程式,亦能偵測用戶情緒並做出適切回應;可即時翻譯餐牌、瞭解菜餚背景並提供推薦。未來更支援語音對話和視頻交流,如詢問體育賽事規則。在語音識別及翻譯方面較現有模型優勝,尤其支援低语言资源

GPT-4o文字及圖像功能即時開放予所有用戶使用,但免費用戶使用上限較低。語音及視頻功能將於未來數周內推出,僅限付費用戶使用。OpenAI將陸續為免費用戶開放GPT-4級別智能功能,涵蓋網絡資訊連接、數據分析和製圖,以及文件總結、編寫或分析。

OpenAI同時推出ChatGPT桌面版,首階段只面向Mac用戶,支援透過語音及畫面直接與助手對話,付費訂閱用戶即可使用,Windows版則將稍後推出。有見及Google I/O開發者大會即將召開,業界認為OpenAI此舉或有先發制人之意。至於Google人工智能Gemini的反應,將於未來數日揭曉。

伸延閱讀

消息來源

 
突发新闻
这是一篇突发新闻報導。
文章内容可能随时修改。请引用可以用到的所有来源