外媒:Google發布Gemini更多是為行銷仍落後於GPT-4
本週三谷歌發布了最新的人工智慧模式Gemini。谷歌聲稱該模型在一系列智力測試中的表現優於OpenAI的GPT-4模型和「專家級」人類,但從技術指標來看,Gemini僅比OpenAI推出已有八個月的GPT-4模型好一點點。在上述消息推動下,美股週四收盤,Google漲5.31%,報136.93美元,市值1.7兆美元。
一年前,Google被OpenAI的聊天機器人ChatGPT打了個措手不及,從此就一直渴望描繪出自己在人工智慧領域快速進步的畫面。本週三谷歌突然提前發布了新的人工智慧模型Gemini,可以發現魔術中的技巧,並在會計認證考試中取得好成績。谷歌發布的演示影片也在社群媒體上引起了轟動,但從技術角度來看,Google仍然在追趕OpenAI。
從GoogleGemini與OpenAI頂級模型GPT-4的效能對比來看,Google最強大的Gemini Ultra在高中物理、專業法律測試以及道德場景等大多數基準測試中都優於GPT-4。要知道,目前的人工智慧競賽幾乎完全是由這些能力定義的。
但在大多數基準測試中,Gemini Ultra只比GPT-4高出幾個百分點。換句話說,Google所謂的頂級人工智慧模型較OpenAI至少一年前完成的工作效果提升有限。
如果Gemini Ultra真如Google所說那樣在明年1月初發布,那麼可能不會在頂級人工智慧模型的頭把交椅上待太久時間。在Google努力追趕OpenAI的過程中,後者有將近一年的時間來開發新一代人工智慧模型GPT-5。
谷歌發佈在社群媒體X上的示範影片乍看之下令人印象深刻。谷歌的人工智慧模型能夠追蹤塑膠杯下的紙球,或者在勾勒出圖片輪廓之前就推斷出會是一隻螃蟹,這些都顯示出谷歌DeepMind人工智慧實驗室多年來訓練的強大推理能力。這是其他人工智慧模型所缺少的功能。但影片中展示的許多其他功能並不是Google獨有的,ChatGPT Plus3也可以做到,華頓商學院教授伊森·莫里克(Ethan Mollick)就用實驗證實了這一點。
此外,谷歌也承認演示影片被編輯過。該公司在影片描述中表示:「為了達到演示效果,我們縮短了延遲時間,Gemini的輸出也壓縮了。」這意味著模型做出回應所花費的時間實際上比影片中顯示的還要長。
事實上演示也不是即時的,也沒有透過語音互動完成。谷歌的一位發言人在談到這段影片時表示,這段影片是「使用影片中的靜止圖像幀,並透過文字提示」製作出來的。有網站展示了其他人如何透過手勢、繪畫或其他物體的照片與Gemini互動。換句話說,示範影片中的聲音只是解釋給Gemini做了哪些人工提示,Gemini輸出的依舊是靜態圖片。這似乎與Google所謂一個人可以與Gemini進行流暢對話、模型可以即時觀察周圍世界並做出反應的暗示完全不同。
示範影片也沒有說明展示是Gemini Ultra人工智慧模型。這些細節表明,谷歌更多是在進行行銷,希望人們記住自己擁有世界上最大的人工智慧研究團隊之一,並且比其他任何人都能獲得更多數據。正如Google在周三所做的那樣,該公司希望在Chrome、Android和Pixel手機上推出適用於終端設備的Gemini模型,提醒人們公司的部署網路規模有多龐大。
但在科技業,無所不在並不總是看起來那麼有優勢。早期的手機霸主諾基亞(和黑莓)就經歷過慘痛教訓,蘋果用功能更強大、更直觀的iPhone搶走了它們的市場。在軟體領域,商業上的成功往往來自於表現最好的系統。
幾乎可以肯定的是,Google這番操作是為了利用OpenAI最近的動盪局勢。據報道,當OpenAI董事會暫時罷免首席執行官薩姆·奧特曼(Sam Altman),使公司的未來發展受到質疑時,谷歌迅速發起了一場營銷活動,說服OpenAI企業客戶轉向谷歌。現在,隨著Gemini的發布,Google似乎正在利用這種不確定性。
但演示的效果有限。谷歌之前已經展示過新技術,但沒有任何進展。到目前為止,Google的龐大架構和層疊複雜的產品經理設定使其無法像OpenAI那樣靈活發布產品。隨著全社會努力應對人工智慧的變革性影響,谷歌的最新舉措並不是一件壞事,但效果有待觀察。可以肯定的是,谷歌仍然在後面努力追趕。