GPT 4o意味著什麼?科學家Jim Fan:OpenAI加蘋果AI手機勢不可擋
ChatGPT帶飛Siri?當地時間5月13日上午10點,OpenAI在春季發表會上發布了GPT-4的迭代版本-GPT-4o。據悉,GPT-4o的速度是上一代的兩倍,並且對用戶更友善:語音喚起、即時對話、無需註冊、免費使用。 OpenAI表示,GPT-4o及其文字和圖像能力即日起將開始向API和用戶推出,語音和視訊能力即將推出。
從定位來看,全新的旗艦版本GPT-4o似乎正在挑戰Siri。
實則不然。就在先前,有媒體報導透露,蘋果已經與OpenAI達成協議,將在全新作業系統iOS 18中引進ChatGPT技術,以升級Siri的對話體驗。
這不由令人猜想,GPT-4o和Siri將如何結合? ChatGPT和蘋果又將如何定義新一代AI手機?
GPT-4o升級在哪?
1)融媒能力:GPT-4o同時具備文字、圖片、視訊、音訊多方面的能力,即可接受任何文字、音訊等形式及其組合的輸入,並產生同樣媒介形式的回答。
2)速度更快:GPT-4o的速度是上一代的5倍,語音延遲大幅改善,可以在232毫秒內回應音訊輸入,平均為320毫秒,接近人類對話的反應時間。這意味著用戶可以和GPT-4o即時對話、甚至直接打影片讓Ta在線上解答各種問題。
3)免費開放:儘管「價格戰」的風還是吹到了AI界,但OpenAI顯然不買賬——發布會即日起,GPT-4o將面向ChatGPT的所有付費和免費用戶發布,取消其他所有限制,API價格降價50%。
正如發布會所說,GPT-4o中的“o”代表“omni”,意為全能,從目前的功能更新來看,得到全棧優化的全新GPT-4o真正成為了一款AI實時語音助手,性能遠遠超越Siri。
示範中,GPT-4o也展現出宣傳點以外的小功能,但驚喜程度不亞於前者:能夠即時翻譯、辨識表情,可以透過攝影機辨識畫面寫程式分析圖表。
「蘋果+OpenAI」將如何定義AI手機?
因下一代iPhone作業系統計畫發布基於LLM(大型語言模型)的新功能,蘋果正就此尋找第三方合作夥伴,談判對象包括Google、OpenAI。
就目前看來,蘋果和OpenAI的適配度似乎更高。
有分析指出,蘋果和OpenAI的合作能夠解決彼此在發展邊緣AI的痛點,真正做到各取所需——
OpenAI最需要什麼?端側應用權限、系統級權限,只有蘋果能提供。
蘋果最需要什麼?最好的AI技術,最適合的大語言模型,GPT-4o無疑是最佳人選。
況且,蘋果在自研晶片、封閉生態系上還具有獨特優勢。正如英偉達高級研究科學家Jim Fan在X平台的評論:誰先贏得蘋果,誰就贏得了勝利。
我認為與iOS的整合將出現3個層級:
1)放棄Siri。 OpenAI為iOS提煉出更小型、純設備上的GPT-4o,並可選擇付費升級以使用雲端。
2) 將相機或螢幕傳送至模型中的本機功能。神經音訊/視訊編解碼器的晶片級支援。
3) 整合iOS系統操作API和智慧家庭API。 Siri快捷方式是時候復活了。
這可能會成為從一開始就擁有10億用戶的AI產品,OpenAI之於蘋果類似於「用於智慧型手機的FSD」。
進一步展望,ChatGPT引進iPhone能創造怎樣的新成長故事?
Wedbush分析師Dan Ives在周一的一份報告表示:
「在iPhone 16中嵌入OpenAI聊天框也將開闢新的成長途徑,這將讓重要的開發者以及微軟開發者生態系統一起湧入蘋果生態系統。從本質上講,與OpenAI建立緊密的合作關係將改變遊戲規則,而對於微軟/OpenAI來說,與全球最大的電子消費品牌捆綁將是一個明智的選擇。
Ives預計,蘋果將在6月10日的WWDC大會上官方宣布和OpenAI的合作關係,並推出基於蘋果LLM的AI聊天機器人。