OpenAI谷歌蘋果再燃AI爭霸戰誰將擔綱「Her」時代王者?
下週開始,矽谷科技巨頭將開啟新一輪的AI大戰。 OpenAI、Google、蘋果都將押注AI助手,並發布一系列重磅更新,你準備好了?新一輪AI大戰,即將揭開序幕!
下週一,OpenAI將開啟線上直播,官宣GPT-4升級,甚至還有一個超級「AI助理」等著我們。
OpenAI「音訊AGI研究負責人」Alexis Conneau已更換主頁背景,並與奧特曼同頻——下週我們將見證Magic。
OpenAI研究科學家Bowen Cheng甚至表示,這可比GPT-5酷多了。
這些種種,暗示著真正的「Her」即將登場。
頂著OpenAI的壓力,Google將在第二天的I/O大會上公佈模型新進展,據傳還將發布一個名為“Pixie”個人數位助理,由Gemini加持。
緊接著,微軟將在21日召開Build開發者大會,大概率將OpenAI最新能力整合到自家產品線中,甚至可能會透露最新5000億參數自研大模型MAI-1。
還有萬眾期待的蘋果WWDC大會,將發表整合生成式AI能力的iOS 18系統,並把ChatGPT塞進iPhone之中。
一系列重磅發布,連番轟炸,簡直不給其他公司喘氣的機會。
有網友問道,「蘋果是在放棄自己的『AJAX』人工智慧系統,全力與OpenAI公司合作?還是直到他們的AI能力趕上之前,OpenAI只是權宜之計」?
蘋果內幕人Gurman總結了蘋果的人工智慧策略:
– 設備端LLM(自研)
– 雲端LLM(自研)
– 聊天機器人(可能是OpenAI,也可能是Google)
蘋果不打算自己開發聊天機器人,但意識到市場對此有需求,因此會從外部取得這項技術。這項策略與其在搜尋領域的做法相似。
顯然,現在的局面是,OpenAI與微軟、甚至蘋果透過AI合作捆綁在一起,只剩下Google自己單打獨鬥。
不知,這波AI爭霸之戰,誰勝誰負?
01
ChatGPT可以通話,週一直播再爆料
全網的焦點,還是在OpenAI。
“他們將會發布什麼”,這一話題熱度只增不減,鮮有人討論GoogleI/O大會。
關於週一的發布預測,網友Ananay又有了新發現:
ChatGPT或將具備具備通話能力
其實可以從以下程式碼中,打電話、拒接等關鍵字中,可以看出這項功能。
另外,OpenAI已經部署了webRTC伺服器來實現這項功能,這些伺服器最近也進行了配置。
起初,網友還以為,這是OpenAI部署WebRTC伺服器可能是為了純語音模式,但現在看來,並非如此。
因為,這個功能是由Livekit提供的。 (這是一個可以提供即時音視訊通訊的解決方案)
下面網友評論道,這是不是意味著,ChatGPT能夠主動給我打電話,而不需要我先發起呼叫?
他提出這個問題,是因為在電影Her中,人工智慧助理Samantha主動給男主角打了電話,告知他一些事情。
想像一下,ChatGPT助理主動給你打電話,提醒或查看使用者習慣,將是多麼神奇的一件事。
不過,Ananay表示,這需要用戶自己選擇允許這項功能。
Hallid.ai的共同創辦人indigo也做了一個全面的預測/趨勢猜想。
根據indigo的介紹,GPT-4的新版本應該會依照參數規模不同,分化成多個版本。
昨天,有網友猜測,可能會有gpt4-lite、gpt4-auto、gpt4-lite-auto的版本發布。
而幾天前出現在LMSYS競技場上的gpt2-chatbot,可能是輕量級的GPT-4新版。而且,這意味著,GPT-3.5的使命要結束了,最新輕量版本可能會免費用,同時API價格大降。
至於,奧特曼所說的“魔法”,可能就是升級後的GPT-4——gpt4-auto,具備自主執行Agent任務的能力,記憶力更強,規劃能力更強。
當然,「AI助理」也將Her帶入現實。
來源:indigo
昨天,OpenAI影片生成研究科學家Will Depue發了一張奇點降臨的logo,或許又在暗示著什麼。
02
Google打擂台,或推出AI助理Pixie
在這個與OpenAI和微軟對飆的關鍵時刻,Google明確表示,這場大會發布的內容都是關於AI的。
根據Google官網,本年度的I/O大會將在美東時間5月14日下午1點召開。
據猜測,Google將在搜尋引擎中融合生成式AI,讓用戶可以進行對話式搜尋。
此外,Google也一直在測試新的搜尋功能,例如針對英語學習者的AI對話練習,以及在購物時產生虛擬試穿圖像。
不只是搜尋引擎,更多的Google應用程式也會更深入整合AI功能,例如在Google Maps中幫用戶找到合適的餐廳、購物中心和電動車充電站。
打客服電話時轉接太久怎麼辦?
Google測試的AI新功能甚至可以幫你自動等待轉接,直到有人接聽再來通知你。
除了各種應用,作業系統也不能落下。
上個月Android 15的開發者預覽已經發布,Google將在I/O大會上進一步介紹其中的新功能,可能會加入更深度的Gemini整合。
目前在Android系統中,生成式AI的功能主要由Gemini Nano驅動,用在各種軟體功能中。
例如Magice Compose可以在Google Messages等應用程式中提供回覆建議,Cinematic Wallpaper利用機器學習幫助使用者客製化螢幕桌布。
可以想像一下,有AI進一步參與的Android會帶來哪些更個人化的使用者體驗?例如,更智慧的手機主螢幕、鎖定螢幕介面和通知欄?
去年的I/O大會上我們看到了與ChatGPT競爭的大語言模型Gemini,今年是否會有新的模型出現?
除了Gemini的新版本,或許也可以期待Google推出的圖像和影片大模型。
Reddit上有網友爆料,表示Google存貨中有3個模型已經在測試但還未向公眾發布,估計會在2024 I/O大會亮相。
這三個模型分別是影像生成模型Imagen 3,以及兩個可以對影像進行最佳化、補全的模型Juno和Miro。
據說,Miro還會有影片生成的功能。
此外,Google可能會在今年I/O上發布新版本的AI助理“Pixie”,或許可以取代原有的同類產品Google Assistant。
Pixie由語言模型Gemini驅動,安裝在Google自己開發的硬體設備Pixel上,對其他第三方設備是否開放我們尚未可知。
但這次I/O大會上我們應該不會看到更新版本的Pixel產品,Google已經在近期發布了新版本Pixel 8a,而且已經開放給用戶預定購買。
網路上流出的新版本Pixel 9外觀
預計,Pixel 9與折疊款Pixel 9 Pro Fold預計將在今年秋季發表。
蘋果緊抓救命稻草
同時,面對OpenAI和Google來勢洶洶的AI語音助理衝擊,網友們向蘋果喊話:
留給蘋果的時間不多了!
雖然已有消息指出OpenAI與蘋果即將敲定一項合作協議,讓ChatGPT能夠裝進iPhone中,並為今年的iOS系統提供全新的生成式AI能力。
但蘋果還沒準備放棄自家的Siri。
近日,紐約時代報道,蘋果將對Siri進行升級重組,以應對其他聊天機器人競爭對手。
而這項決定早已做下。
2023年初,蘋果高層Craig Federighi和John Giannandrea花費數週時間測試了風頭一時無兩的OpenAI新聊天機器人ChatGPT後,就深感危機。
他們認為生成式人工智慧的出現讓Siri顯得過時、落後。
Siri作為蘋果2011年推出、每部iPhone中最初的虛擬助手,一直以來都僅限於滿足個人請求,無法跟上用戶發起的對話。
例如,當有人先詢問了舊金山的天氣然後說:「紐約怎麼樣?」時,Siri經常會誤解用戶的提問。
但ChatGPT知道用戶想要的是後一個問題的答案。
在意識到新技術已經超越Siri之後,這家科技巨頭發起了十多年來最重大的重組。
蘋果決心在科技業的人工智慧競賽中迎頭趕上,它將生成式人工智慧作為公司內部的特殊標竿項目,圍繞著十年一遇的計畫來組織員工。
Siri超進化
據蘋果的三名內部人士透露,蘋果將於今年6月10日的年度開發者大會上發布改進後的Siri。
新版本中的基礎技術包含新的生成式人工智慧,將允許Siri與用戶進行聊天而不是一次回答一個問題。
並且使Siri的對話性更強、用途更廣。
Siri的更新是蘋果在全面擁抱生成式AI 領域中處於領先地位的舉措之一。
為了支援其新的Siri功能,在今年的iPhone中也增加了記憶體。
此外,蘋果還討論了與包括Google、Cohere和OpenAI 在內的幾家公司合作,以獲得支援聊天機器人的AI模型使用權的可能性。
另一方面,蘋果的高層也擔心新興的AI技術將作為未來主要的作業系統取代iOS,威脅蘋果在全球智慧型手機市場的主導地位。
並且,這項新技術也可能促成以AI應用(AI智能體)為核心的生態系。
這可能會削弱蘋果的App Store,該商店每年的銷售額約為240億美元。
但蘋果更擔心的是,如果不能開發自己的AI系統,iPhone將會在與其他先進技術的比較中可能變成“啞巴手機”,失去市場。
iPhone目前佔據了全球智慧型手機利潤的85%份額,並創造了超過2000億美元的銷售額。
可以預想這個損失是不可估量的,也是蘋果不能接受的。
在這種危機的迫切感促使下,蘋果取消了另一項重大的投資——
一個耗資100億美元的自動駕駛汽車項目,並調派數百名工程師轉向AI的開發工作。
並且,蘋果也將延續一貫的裝置流程工具上的一致性,探索創建由iPhone和Mac處理器驅動的伺服器。
內部人士的爆料裡,蘋果對Siri的升級並不在於讓它與ChatGPT競爭詩歌創作等內容生成的部分,而是讓Siri專注於處理它原有的任務:
包括設定鬧鐘、建立日曆備忘提醒、新增購物清單中的物品,以及總結簡訊內容。
蘋果計畫宣稱升級後的Siri將比競對公司的人工智慧提供更私密的服務,成本更划算。
因為Siri是在iPhone上處理請求,這避免了資料在雲端的洩漏以及雲端運算的成本。
但是,蘋果也面臨安裝在iPhone上的小型人工智慧系統的風險:
研究發現,較小的人工智慧系統可能比較大的系統更容易出現幻覺。
Siri共同創辦人Tom Gruber表示:
「Siri的目標始終是創造一個能理解語言和上下文的對話介面,但這是個難題。
隨著科技的變革,我們應該可以做得更好。只要不試圖用同一種方法解決所有問題,就能避免很多困難。 」
蘋果在人工智慧領域擁有多項優勢,包括全球超過20億台在使用的設備,領先的半導體團隊等。
它們能夠支援蘋果推廣AI產品,並支援包括臉部辨識在內需要大量晶片的AI任務。
03
一個月時間,蘋果能否扭轉局勢
但在過去的十年裡,蘋果從未制定出一個全面的人工智慧策略,Siri自推出以來也沒有重大的升級改進。
同時,作為語音助理的限制也減弱了公司智慧音箱HomePod的吸引力,因為它無法穩定完成一些簡單的任務,例如回應歌曲播放請求。
曾在Siri團隊工作兩年後,創立了生成式人工智慧平台Brighten.ai的John Burkey表示:
「Siri團隊創立以來,未能獲得與蘋果內其他團隊同等的關注和資源。
而蘋果的不同部門,往往各自獨立,資訊共享有限。
但事實是AI需要被整合到產品中,才能成功。 」
另外,蘋果在招募和留住領先人工智慧人才方面也有著相當的阻力。
由於蘋果的保密性,研究成果發表論文、參加會議的都很少,這對科學家來說幾乎是不可忍受的弊端。
最近幾個月來,蘋果略微調整了一貫的策略,增加了人工智慧論文發表的數量,但業內的研究人員仍質疑論文的質量,認為它們是蘋果的營銷炒作手段。
但對一些初出茅廬且野心勃勃的研究人員來說,加入蘋果能夠成為計畫的領導成員,是他們選擇蘋果的重要原因。
儘管蘋果已調整了發展策略,並吸收了不少新血。
但在這場聲勢浩大、令人眼花撩亂的AI語音助理之戰中,蘋果能否在6月的開發者大會上逆轉劣勢尚未可知。
未來的AI語音助理形態如何,又會如何影響我們的生活?
這個問題的答案正不斷接近我們。