傳聞OpenAI即將推出多模態人工智慧數位助理
根據The Information最新報道,OpenAI 已經向一些客戶展示了一種新的多模態人工智慧模型,它既能與人對話,又能辨識物體。該媒體引述未具名消息人士的話稱,這可能是該公司計劃在周一展示的內容的一部分。
據報道,與現有的獨立轉錄和文字轉語音模型相比,新模型能更快、更準確地解讀影像和音訊。它可以幫助客服人員”更好地理解來電者聲音的語調或他們是否在諷刺”,而且”理論上”,該模型可以幫助學生學習數學或翻譯現實世界中的標誌。
該媒體的消息來源稱,該模型在”回答某些類型的問題”方面可以超越GPT-4 Turbo,但仍然容易十分自信地輸出錯誤答案。
據開發者Ananay Arora 稱,OpenAI 可能還在準備新的內建ChatGPT 電話功能,他發布了上述與通話相關的程式碼截圖。阿羅拉還發現有證據表明,OpenAI 已經為即時音訊和視訊通訊配置了伺服器。
該公司執行長山姆-奧特曼(Sam Altman)明確否認即將發布的消息與這款據稱比GPT-4″更好”的模型有關,傳聞中的GPT-5 可能會在今年年底公開發布。
奧特曼也表示,公司不會宣布新的人工智慧搜尋引擎。但如果《The Information》所報導的內容屬實,那麼Google的I/O 開發者大會仍有可能因此受到影響。 Google一直在測試使用人工智慧打電話。傳聞中的一個項目是多模態Google助手的替代品”Pixie”,它可以透過裝置的攝影機觀察物體,並提供購買建議或使用說明。
OpenAI 計劃於週一上午10 點(太平洋時間)/下午1 點(美國東部時間)在其網站上透過現場直播的方式發布新服務。