擁有一切的谷歌輸掉了ChatGPT首戰
微軟與Google圍繞ChatGPT 的這場龍爭虎鬥,以出人意料的方式揭開了第一季的結局。北京時間2 月8 日晚間,Google在巴黎舉行AI 發布會,向外界正式披露聊天機器人產品Bard。作為ChatGPT 最重要的挑戰者,Google過去兩週沒少為這場發布造勢,但萬眾矚目的產品演示卻出了重大紕漏——Bard 在回答“詹姆斯·韋伯空間望遠鏡的新發現”這個簡單問題時,錯誤地把另一個望遠鏡取得的成就安給了前者。
Google的股價在盤後大跌7.4%,市值一夜蒸發近千億美元。形成鮮明對比的是:投資OpenAI 數十億美元的微軟,半天前剛剛舉行了一場小型媒體活動,發布集成最新版模型的搜索引擎New Bing 和新版瀏覽器Edge,微軟在過去兩天上漲近4%,市值重回2 萬億美元,並在Google翻車、全球ChatGPT 概念回調之際,盤後繼續微漲0.5%。
將Google捲入這場生成式AI 大戰,微軟毫不掩飾自己的想法。“我們的創新,將讓Google come out and dance。我們想讓人們知道,是我們讓他們dance。”微軟總裁納德拉直言。
微軟的嘗試取得了成果,除了市值上漲,AI 功能的加入也如他們預期般,看到了撕開Google搜索引擎長城的曙光。新版功能小範圍開啟試用後,Bing 已經躍居至iOS 免費榜的第12 位,根據data.ai 的初步估計,Bing App 的新下載量增長了10 倍。
但這場圍繞ChatGPT 的生成式AI 戰爭才剛開始,聊天機器人能否動搖搜索引擎的市場格局還有待時間觀察。此外,圍繞大模型的競爭也不止於搜索引擎,今天人們正在使用的大部分軟件和服務都有可能被生成式AI 重塑,更多產品和服務都會被捲入其中。
甚至更進一步,隨著類ChatGPT 以及更廣泛的AI 能力需求的增加,對微軟、Google、阿里、百度和國內外所有的雲服務平台提供商而言,生成式AI 相關能力將成為重要的基礎設施,圍繞後者的競爭,將成為未來數年改變雲服務市場的X 因素。
01
先後發布新產品,
Google跌了,微軟漲了
上一次科技巨頭之間刺刀見紅,還要追溯到疫情前TikTok 掀起的短視頻大戰。ChatGPT 爆火後,資本、創業者和科技巨頭紛紛捲入,科技圈的熱鬧恍如隔世。
打響第一場白刃戰的是Google和微軟,主題是搜索引擎。2 月2 日Google宣布,8 號將舉行現場發布會,介紹有關搜索引擎的最新產品。一周內,先是微軟短暫上線疑似“集成GPT-4 的Bing 搜索版本”激起人們的好奇,隨後Google總裁Pichai 於2 月6 日公佈了用於搜索服務的聊天機器人Bard,同一天,微軟公佈要在Google發布會的前一天7 號舉行發布會,介紹最新的搜索引擎New Bing 和瀏覽器Edge。
“這是搜索的新一頁,新的範式已經出現,軍備競賽從今天開始。”發布會上,納德拉充滿信心地宣布。ChatGPT 走紅後,業界很快意識到,大語言模型對於更新搜索產品的臨界點到來了。在最新的產品發布中,Google和微軟共同強調了這一點:以自然語言提問查詢,AI 基於多方信息、返送重新創作後的針對性回答。用戶還可以基於首輪迴答,再進行追問。
兩家都給出了購物場景下的查詢案例。
比如Google:我想為家庭買一輛新車,應該考慮些什麼?Bard 會建議你考慮預算、座位數、設計特點、安全性、動力類型幾個維度。接下來,你可以追問,如果想買一個電動車型,有什麼優勢/不足?
還可以將對話的主題從選車,轉移到旅行計劃。你可以接著問Bard:第一次長途自駕將會從舊金山到聖克魯斯,沿途有什麼停車點?
對比之下,微軟展示的產品體驗則更完善。
在微軟的演示中,給出了挑選電視的例子。當你在搜索引擎中輸入“最好的65 英尺電視”,Bing 就會為你羅列出不同的產品。在展示形式上,Bing 的回答會在頁面的右邊欄框中,這樣保證了用戶可以同時看到傳統搜索引擎給出的鏈接、以及生成式語言模型給出的綜合回答。這也是微軟所謂的“副駕駛”體驗。
當想進行追問,則可以從“chat”選項切入,進入對話界面。基於已有的答案進行追問:哪一款最適合遊戲?在給出的回答中,也可以繼續追問,哪一款最便宜?
從產品的形態設計上而言,微軟更為完備,考慮到了問答與傳統搜索模式之間的自由切換。而Google目前僅僅展示了問答部分的產品形態。
更關鍵的部分在於,在Demo 的展示中,微軟顯示了信息來源,以角注和“Learn More”的形式供用戶核實與進一步了解。在Google的Demo 演示中則沒有這個部分。
此外,Google還展示了向Bard 提問開放式問題。例如:觀星時最好的星座是什麼?搜索頂部的位置也會返回生成一段答案,同樣沒有顯示信息來源。
這帶來的隱患是,當答案裡有信息錯誤時,更難以核查。Pichai 在Google博客中展示的第一個Demo,就出現了這樣的問題。回答“怎樣向9 歲的孩子解釋詹姆斯·韋伯空間望遠鏡的新發現?”時,Bard 稱韋伯望遠鏡拍攝到了首張地外行星的照片。這就是一個事實性錯誤,這一成就實際上來自2004 年的智利甚大望遠鏡;此外,第一條中“2023 年,韋伯望遠鏡發現了大量暱稱為『綠豌豆』的星系”的時間也出現了錯誤,應該是2022 年7 月。
這樣的事實性錯誤,ChatGPT 經常犯,如今出現在了為Bard 提供技術支持的L AMD A。這種錯誤,成為搜索引擎的服務時,就會影響到使用者對產品的信任。因為沒有信息來源,使用者也無法通過核對發現錯誤。產品Demo 中出一次生成答案就出現兩次錯誤,給用戶帶來了強烈的不良觀感。
而沒有顯示引用來源,也招致了搜索引擎產的行業人士對目前產品形態的不滿。“引用必須要有,希望這不是Google前進的方向,這樣不對”,“在目前的實驗形式中,我沒有看到任何的歸因或引用,沒有鏈接,沒有點擊。這是對出版商的戰爭……”兩位行業人士評論道。
真實產品與期待值的落差,致使Google盤後大跌。但這也是今天聊天式機器人產品需要面對的現實,甚至從某種意義上來說,在語言大模型積累多年的Google,即使將最新功能加入搜索產品,還有許多影響用戶體驗的問題需要解決。
02
Google的謹慎與無奈
從目前更新的產品形態上來看,Google落後微軟。而從之前傳出的Picha 在內部發起“紅色警報”(Red code)、搜索引擎兩位創始人重回公司商討AI 戰略等消息來看,Google的確是在ChatGPT 大火之後,調整策略,緊急迎戰。
ChatGPT 的爆火,讓公眾形成了印象,這是目前最先進的技術。但是在學術界則認為,ChatGPT 並沒有在技術上領先很多。
喬治亞理工學院的計算機教授、機器學習專家Mark Riedl 對媒體表示,ChatGPT 背後的技術並不一定比Google和Meta 更好。但OpenAI 公開語言模型,讓公眾使用這一行為,帶來了極大優勢。
深度學習三巨頭之一、Meta 研究院院長LeCun 對媒體表示:“(ChatGPT)這不是什麼革命性的東西,儘管公眾是這麼認為的”,“這是很好的組合,這是很好的做法。”不僅如此,剛剛離職的OpenAI 的前產品負責人Fraser 表示贊同LeCun 的觀點,並說“這本不該引起爭議”。
LeCun 在Twitter 上解釋,“我不是批評Open AI 的工作和他們的主張。我試圖糾正公眾和媒體的看法,他們認為ChatGPT 是一個令人難以置信的全新的、創新的、獨特的技術突破,遠遠領先於其他所有人,事實並非如此。”
大公司差不多同時期開始研究語言大模型。第一個重要的技術突破是2017 年Google的神經網絡架構Transformer,這也是從去年開始爆火的生成式AI 模型所用到的底層技術。Transformer 能夠讓機器在處理語言信息時關注單詞之間的聯繫,並預測接下來會是什麼單詞。這大大增強了模型對於語言的理解能力。
2017 年的Transform 網絡論文,成員大部分來自Google|來源:arXiv
隨後,Google於2018 年發布了預訓練大模型BERT;2021 年,OpenAI 發布了預訓練模型GPT-3,已經表現出了很強的寫作、對話能力,但也表現出致命缺陷,就是“口無遮攔”,會生產極端種族主義、暴力等相關的內容;同年,Google發布了預訓練模型LamDA,也顯示出了良好的對話能力。
ChatGPT 最初的項目名稱為“Chat with GPT-3.5”,是在GPT-3 與即將發布的GPT-4 之間,OpenAI 因為擔心對手公司提前發布聊天機器人ChatBot,而臨時確定的項目。工作人員接到的任務是,在兩週之內快速發布一個聊天機器人。讓所有人驚訝的是,它能在短時間吸引如此多的使用者,並加速了AI進入搜索產品的進程,隨之引發了Google與微軟間的較量。
ChatGPT 走紅不久,Google內部便開始了擔憂。“對於Google來說,這是一次錯失良機嗎,畢竟我們已經擁有LamDA 一段時間了。”
12 月初的內部會議上,這個問題為員工們所關注。那時,Google AI 部門主管傑夫・迪恩(Jeff Dean) 表示,Google擁有類似能力,但如果出現問題,代價將更高,因為人們必須相信從Google得到的答案。在技術公開和產品化上一直行為保守,對聲譽風險的擔憂是重要因素。
Google員工們表示,多年來,員工一直在提議將聊天功能加入搜索,這也是很明顯的演變趨勢。但是Google有充分的理由不著急迭代,不僅僅因為返送更有針對性的回答會減少廣告空間。而是如果Google提供的聊天機器人給出一個不健康或者抄襲而來的答案,就會增加責任風險。而就外部環境而言,Google這幾年一直面臨反壟斷審查或訴訟,再增加這樣的道德風險肯定會帶來更大壓力。
如今,像墨菲定律起作用一樣,Bard 所犯的錯誤,恰恰是Google原先所擔心的問題,並在Google與微軟第一次亮相比拼中,帶來了負面效應。在技術封裝進產品這一步上,Google因前期保守、倉促應戰而落後。
摩根士丹利的分析師Brian Nowak 表示,語言模型可能搶占市場份額,並擾亂Google作為互聯網用戶入口的地位。從Bing App 下載量增長10 倍來看,這個擔憂絕對不是空穴來風。但基於Google的技術儲備,他也表示,期待Google更多的產品表現。
03
搜索引擎戰之下,
AI 成為戰略重心
無論是微軟還是Google,目前兩家發布的新產品尚未完全放開使用。
微軟的New Bing 需要登記WaitList,等待功能發放。截止發稿,我多次嘗試從Edge 官網進入New Bing 的Waitlist 頁面,尚無法打開。
New Bing Waitlist 頁面無法打開|來源:凌梓郡
而Google的Bard 目前僅開放給受信任的測試人員,在這之後,將是依托LaMDA 輕量級模型版本發布。“在未來幾週,我們會繼續向更廣泛的公眾開放此服務。”Pichai 在博文寫道。
因此,產品模型僅僅是做了演示,還沒有大規模發放到用戶手中體驗。之前人們所關心的問題,比如胡編亂造、大規模使用的成本問題,目前還只停留在討論階段。
成本是必然需要面對的因素。據了解,Google未來會優先使用輕量級版本的LamDA,就是出於計算成本的考慮。
此前,OpenAI CEO Altman 表示,ChatGPT 回復一次的成本為幾美分。Brian Nowak 估計,ChatGPT 每次查詢的成本約為Google每次傳統搜索查詢成本的7 倍,如果依托微軟的雲服務Azure 提供最低價,可以降低到傳統搜索成本的4 倍。考慮到搜索是一個日均百億級使用次數的高頻行為,長期運行,潛在的成本增加是一個天文數字。
微軟官方披露,這次的New Bing 背後驅動的是下一代語言模型,比ChatGPT 更強大,也是專門為搜索制定的。在發布會後的問答環節,對於成本問題,微軟的態度也很乾脆,“我不打算回答這個。”對於模型胡編亂造的問題,回應則是“我們從一開始就在做這件事。我們正在衡量該模型在搜索結果中哪些地方沒有站穩腳跟,但它並不完美。”
納德拉說,“AI 將從根本上改變每一個軟件服務類別,從最大的軟件服務類別——搜索開始。”搜索引擎的變革剛剛開啟,依舊有許多尾部問題需要花費時間解決。從產業角度而言,它或許意味著,以大模型為基礎,AI 進入了全新的階段。這或許是微軟、Google、Meta 甚至蘋果,以及國內的阿里、百度都在戰略層面開始規劃的原因。
目前,Google和微軟都處於類似的時期,主要業務疲軟。前不久,兩家都交出了一份不太理想的2023Q2 財報,接下來業務增長的預期也不高。Google廣告收入出現上市以來第二次下滑,雲業務雖然保持兩位數增長,但同比增速正逐季回落。微軟主要的Office和Azure 業務增速都在放緩。整體業績疲軟,收入增速為2%,持續下滑。納德拉表示,微軟在2022 年末就面臨著核心業務Windows+Office 的業績下滑。
與此同時,兩家都在財報電話會上強調了AI作為戰略的重要性。
Google表示,從下個季度開始,其研究機構DeepMind 的財務狀況將單獨列出,體現在季報中。“AI 已經成為Alphabet 的戰略重心,我們也看到AI 領域潛藏的巨大機遇。目前DeepMind 的研發領域將成為Alphabet 未來產品組合的核心。”前不久,Google便通過投資Anthropic 3 億美元,成為其云供應商。
微軟主要強調了在過去的三年多時間裡,微軟致力於訓練超算、打造推理基礎設施,為未來AI 進入應用程序做準備。也就是意味著,微軟的雲設施和服務,需要嵌入更強的AI 能力,“對於Azure 來說,AI 將是其核心組成部分”、“我們希望為大家提供的也遠不止Azure OpenAI 服務。如何將OpenAI 與微軟的Azure Synapse 分析服務相結合等,都在我們的考慮範圍之中。”
不難看出,無論是Google還是微軟,都將會以大模型為基礎設施,加快產業佈局,其中的重要部分包括嵌入AI 能力的雲設施、基於大模型的API。Forrester Research 公司AI 分析師Rowan Curran 表示,微軟可以利用目前與Open AI 的合作與熱度,獲得更重要的短期回報,這便是擴大Azure 、OpenAI API 及更廣泛AI 和機器學習平台的需求。
長期來看,當搜索產品大規模上線,穩定提供服務,可靠性和成本將成為更重要的影響因素,這也將考驗雙方基礎設施的能力。
大模型領域獨角獸Stability AI 的創始人Emad 曾表示,ChatGPT 將打敗Google的故事聽起來有點愚蠢。因為Google擁有最好的LLM(語言大模型)全套團隊和定制芯片,沒有競爭對手可以在創新、成本、或者市場上和其較量。這些基礎設施包括PalM(單項語言模型)、LAMDA、Chinchilla(少量參數語言模型)、MUM(多任務統一模型)、TPU 等。
很明顯,Google首戰的表現出乎了所有人的預料。面對有OpenAI 的模型能力加持、來勢洶洶的微軟,全世界見證了一場巨人的跌倒。