知名聊天機器人「ChatGPT」的製造商OpenAI,當地時間週一宣布,推出新的人工智慧模型「GPT-4o」和ChatGPT桌機版本,更新用戶介面,號稱速度更快,文字、視覺和語音功能也得到了全面提升與整合,未來所有用戶將能免費使用,但付費用戶將享有更大的容量上限。
綜合《CNBC》等外媒報導,OpenAI面臨日益激烈的競爭,以及擴大ChatGPT用戶群的壓力,在週一的直播中,研究人員展示了ChatGPT的新語音助理功能,包含利用其視覺和語音功能與研究人員對話,解決數學方程式問題。
在另一項演示中,研究人員則展示了GPT-4o模型的即時語言翻譯能力,進一步延伸至「聽聲翻譯」,比如,測試人員分別以義大利文和英文說話,隨後新模型就把雙方交談的內容翻譯成各自的語言。
不只如此,新模型能「感知」使用者的情緒,透過用戶的面部表情,分析對方可能正在經歷的心情狀態,播放音樂舒緩使用者情緒,還能處理被使用者突然打斷的狀況,甚至可以變換聲調,為使用者講睡前故事。
OpenAI技術負責人穆拉蒂(Mira Murati)表示,新模型將使ChatGPT能夠處理50種不同的語言,GPT-4o的速度是GPT-4 Turbo的2倍,成本卻只有GPT-4 Turbo的一半,平均響應時間僅爲320毫秒,與人類在對話中所需的時間相似。
報導指出,隨著「生成式人工智慧淘金熱」蔓延,幾乎所有科技大廠都在爭相開發新服務,以免一不留神,就被競爭對手拋在後面。數據顯示,2023年生成式人工智慧投資額達到創紀錄的291億美元,比前一年多了260%以上,預計10年內甚至會突破1兆美元。預計GPT-4o的推出,將重新定義數位助手的功能和用戶體驗,也標誌著OpenAI在其技術開發上的一次重大躍進。
值得注意的是,穆拉蒂在發表會尾聲,還感謝輝達(Nvidia)執行長黃仁勳(Jensen Huang)及其公司,替OpenAI提供所需的、先進的圖形處理器(GPU):「讓今天發表會的功能展示成真。」