Google這一年:從恐慌到豪賭 All In AI大戰
下一步,Google需要把Gemini大模型整合進旗下產品,同時又不蠶食搜尋等現有業務份額。今年年初OpenAI的崛起令全球震驚,而微軟將ChatGPT嵌入必應更是令Google倍感威脅,Google是如何用一年時間在AI競賽中重新站穩腳跟?
根據媒體發布的一篇文章,這家科技巨頭首先平息內鬥,合併兩大人工智慧部門,其次加速研發AI模型,推出多模態模型意圖追趕OpenAI,最後憑藉在晶片、模型框架等全方位佈局,推出強大的Gemini模型開始反攻。
現在,Google走到了最困難一步——將Gemini大模型整合進旗下產品。
以下為華爾街見聞編譯的原文:
不管是Google還是其他公司,這都是一個值得回顧的時刻,他們顯然戰勝了那些末日論者。
上週,Google發布了備受期待的新人工智慧模型Gemini,而在此近一年前,一些評論家曾預測OpenAI 的 ChatGPT 可能會挑戰Google在搜尋領域的領導地位。 Google積極應戰OpenAI,領導階層設法讓公司內部相互競爭的部門開始合作,共同製定應對方案,從而擊退了那些認為Google變得過於優柔寡斷和官僚主義的人。如今Google在搜尋領域的主導地位依舊,就連其股票也在今年一路上漲。
現在辛苦的工作開始了,在接下來的幾個月裡,Google必須證明自己能夠將Gemini整合到旗下的產品中,同時又不蠶食搜尋等現有業務份額。
該公司已經將一個簡化版本的Gemini應用到Bard中,該聊天機器人是該Google為與ChatGPT競爭而創建的,但迄今為止使用率似乎有限。兩位熟知內情的人士說,未來,該公司計劃將Gemini應用於幾乎整個產品線,從搜尋引擎到生產力應用軟體,以及Pixel設備獨有的AI助理Pixie。據一位了解內部討論情況的人士說,產品還可能包括可穿戴設備,例如眼鏡,它可以利用人工智慧識別佩戴者看到的物體的能力,然後該設備可以向佩戴者提供建議,例如如何使用工具、解決數學問題或演奏樂器。
Google在做這些事的同時,也必須小心翼翼地與監管機構周旋。該公司正處於兩場關於其搜尋引擎和廣告業務的反壟斷鬥爭中。反壟斷官員正密切關注Google的人工智慧工作,並將其視為Google如何利用在某一領域的優勢在另一領域取勝的範例。在這種情況下,Google利用其搜尋中的網站資料以及數十億客戶的資料來訓練新的人工智慧。
人工智慧的成功對於Google的雲端運算業務也至關重要,對運算需求極高的人工智慧模型正在激發對雲端服務的需求。微軟與OpenAI 建立了緊密的合作關係,其雲端業務的成長速度已經超過了Google和亞馬遜。
雖然ChatGPT因其對話式AI而聞名,但其背後的技術已被證明在整個商業領域都非常有效,從自動化客戶服務和軟體編碼,到快速生成行銷方案,以及幫助華爾街公司理解大量數據。 Google面臨的問題是,OpenAI 和微軟在向消費者和企業銷售這項技術方面已經占得先機,為他們提供了寶貴的數據和回饋,他們可以利用這些數據和回饋來改進產品。
“只有親⾃試了之後,才能夠判定是人們能用它創造出什麼,我們才剛剛開始看到這一點,但已經看到的是非常了不起”,Madrona Venture Group 的合夥人Jon Turow指出,他曾在亞馬遜雲端運算部門負責人工智慧產品。
Gemini是Google25年歷史上投入最大的努力之一,隨著Google步入中年,其核心廣告業務繼續創造巨額利潤,這也為其母公司Alphabet在自動駕駛汽車、健康保險和生物技術等新業務上的一系列押注提供了資金,但是這些下了十年的賭注都沒有得到回報。
因此,越來越多的投資者要求Google領導層削減18.2萬人的成本,今年的大規模裁員打擊了員工士氣。同時,Google正準備在新的一年進行更多的裁員,但目前還不清楚裁員的範圍是廣泛的還是針對特定群體。
人工智慧是另一個賭注,需要公司投入巨額資金,支付從人員到硬體的一切費用。一位與Gemini團隊關係密切的人士表示,Google需要投入大量資金來抵禦人工智慧團隊向OpenAI倒戈的威脅。
Google也選擇了一種特別昂貴的技術方法,即設計自己的人工智慧晶片。這項決定使Google在硬體上獨立於英偉達,後者是人工智慧伺服器晶片的主要供應商。 OpenAI等競爭對手依賴英偉達和其他公司生產的硬體。
Google也希望消除人們對它的看法,即它的成果不過是靠幾十年前的創新成果。多年來,Google透過 Google Brain 和 DeepMind 兩個獨立的部門為人工智慧研究投入了大量資金。 Google甚至發明了transformer的底層技術,該技術是OpenAI創建的GPT系列人工智慧模型的核心。
但是,OpenAI的崛起讓人們擔心,Google可能會像之前的許多其他老牌科技巨頭一樣,在技術上失去領先地位。根據一位直接了解Google與微軟討論情況的人士透露,在Google內部,微軟在今年2月將 ChatGPT納入必應搜尋引擎,這讓Google的高層尤其感到不安。
Google發言人未就此事發表評論。
AI部門內鬥
多年來,Google和 Alphabet 的執行長桑達爾-皮查伊一直向同事抱怨,他無法讓旗下的兩個人工智慧研究部門合作。 Google2014 年收購了DeepMind,該公司執行長Demis Hassabis長期以來一直堅持獨立於母公司,他認為這樣的安排可以讓公司更好地實現開發通用人工智慧的目標。
同時,DeepMind的姊妹部門Google Brain專注於研究如何將AI應用於Google的產品,並孵化了機器學習領域的重要進展,如transformer,這項發明為Google和其他公司訓練更複雜的模型鋪平了道路。該部門由Jeff Dean領導,他是一名資深工程師,在Google成立初期,他的程式設計工作幫助Google將搜尋引擎擴展到數十億用戶。
兩個部門之間的分歧很深,Google Brain的總部位於加州山景城的Google總部,而Hassabis和他的團隊則在倫敦國王十字車站附近的辦公室。
一位曾在DeepMind工作的人士說,隨著公司規模的擴大,DeepMind不遺餘力地避免與Google大腦合作。例如,在Google大腦當時沒有主要業務的城市,如巴黎和阿爾伯塔省的埃德蒙頓等地開設辦事處。 DeepMind的研究人員可以存取Google Brain編寫的程式碼,但反之不行。有些員工認為這是 DeepMind 過度保密的表現,甚至在Google員工中也是如此。當Hassabis想採取措施保持 DeepMind 的獨立性時,他會直接與聯合創始人Larry Page溝通,後者與聯合創始人Sergey Brin一起主導了收購,並擁有 Alphabet的控股權。
一位知情人士說,隨著時間的推移,Hassabis希望將DeepMind 與Google更徹底地分開,因為他越來越擔心這家龐大的公司會如何使用這項技術,包括將其出售給軍方。他萌生了創立獨立公司的想法,該公司將擁有DeepMind 的智慧財產權。但在2021年,Hassabis告訴DeepMind的員工,在皮查伊承諾向該公司提供更多資金用於包括人工智慧倫理在內的目的後,脫離Google的努力已經結束。
多年來,對資源的競爭加劇了兩家公司之間的緊張關係。 Google向其人工智慧研究人員發放的伺服器晶片數量有限。隨著全行業對人工智慧的狂熱促進了對晶片的需求,這些晶片變得更加稀缺。
同時,隨著Google高層深陷內部政治泥潭,公司著名的人工智慧研究人員也開始紛紛出走。其中一些成立了自己的公司,他們對Google的官僚文化感到沮喪,因為在 OpenAI推出類似ChatGPT的服務之前,Google的官僚文化早已阻礙了ChatGPT的發布。還有一些人則被OpenAI收購,OpenAI是馬斯克和其他知名人士於2015年以非營利形式創辦的一家新創公司,部分原因是他們擔心Google將擁有人工智慧的未來。 OpenAI的創辦人之一是Ilya Sutskever,他是Google大腦的重要工程師,後來領導了多項進展,例如創造出可以透過推理解決未曾遇到過的問題的人工智慧。
去年11月,當 OpenAI 發布 ChatGPT 時,公眾的反應在整個Google引起了震動。這家400人的新創公司竟然擊敗了Google,推出了一個可以令人信服地回答各種主題問題的聊天機器人,這讓Google的競爭力受到了質疑。
不過,Google的一些領導似乎並沒有被這個網路新寵兒嚇到。一位知情人士說,在 ChatGPT 推出幾週後的一次員工會議上,Dean在回答有關聊天機器人的問題時說,Google不會對其他新創公司的做法做出反應。
但到了二月,微軟宣布將在其必應搜尋引擎中應用ChatGPT是。一些投資人認為,聊天機器人可能會削弱Google在搜尋領域的主導地位,這一觀點令Google的高層感到危險。
思想的融合
Google需要做一些事情,而且要快。
於是,Google在短短幾個月內拼湊出了Bard聊天機器人,並於今年3月正式發表。在Google內部,這項工作引起了軒然大波,因為Google的一位著名研究員Jacob Devlin向皮查伊和其他高管提出了對Google使用 ChatGPT 的數據來訓練人工智慧模型的擔憂,隨後他辭職了。他立即加入了 OpenAI,但僅僅幾個月後,他又回到了Google,原因不得而知。
Google的另一個回應是最終結束了DeepMind和Google Brain之間的內鬥。 Google從這兩個團隊中選拔研究人員,建立了一個新的模型:Gemini模型由Dean和DeepMind高級研究員Oriol Vinyals領導,後者曾與Dean在大腦共事。
今年4月,Google宣布合併Google Brain和DeepMind。 Hassabis接管了新實體–Google DeepMind,而Dean則退居二線,成為Google的首席科學家。這一舉動讓許多Google工程師感到震驚,他們認為,鑑於Dean的成就和在公司工作已久,他本應成為該部門的領導者。
領導者試圖把合併說成是合併後部門的勝利,Google Brain負責研究的副總裁Zoubin Ghahramani訪問了 DeepMind 的倫敦辦公室,在宣布變革的那一周召開的全體會議上向員工解釋了重組的原因。 Google Brain為自己的員工單獨召開了一次會議。 Hassabis告訴員工們,GoogleDeepMind將匯集世界上最好的兩個人工智慧研究團隊。
但Google的人工智慧員工很快就意識到,工作重點也在改變。 GoogleDeepMind的領導階層縮減了打造有競爭力的人工智慧產品並不重要的研究項目。這些人說,失去資源的項目包括一個名為Gato的多模態模型以及一個名為GenRL的研究團隊,該團隊建立的人工智慧系統能夠在虛擬環境中導航,就像雅達利遊戲中的虛擬環境一樣。
高層說,這些變化還有一個額外的好處,減少工作重疊,削減優先順序較低的項目,這意味著員工不必再為獲得用於研究的晶片而爭得頭破血流。
在山景城,分佈在公司園區多棟大樓的人工智慧員工搬到了位於園區中心的一間辦公室,目的是加強研究人員之間的合作。
隨著OpenAI爆炸性崛起的衝擊逐漸消退,Google終於迎來了反擊的機會。
“秘密武器”
儘管如此,Google仍面臨著一個巨大的挑戰:建立一個表現優於OpenAI最先進模型GPT-4的模型。
從一開始,這就意味著研究人員必須在最後期限前完成模型開發。為了在緊迫的時間內完成任務,員工們不分晝夜地工作,這種自上而下的工作方式與Google以往對研究實驗室放手不管的做法大相徑庭。一位與這項工作關係密切的人士說,一些員工每週工作80小時已成為常態。
即使在公司的人工智慧之外,Google員工也被要求迅速掌握這項技術。據兩位知情人士透露,在這一年裡,Google雲端要求員工通過人工智慧方面的測試,並為銷售等非技術職位的員工提供額外的材料,從而推動員工提高人工智慧知識水平。
Google的目標是透過賦予Gemini理解各種不同媒體(包括文字、圖像、視訊和音訊)的能力,從而較OpenAI更有優勢,例如,人工智慧可以用簡單易懂的英語解釋和說明複雜圖表的內容。皮查伊後來說,Gemini將從頭開始 根據這些類型的資料進行訓練。皮查伊很清楚,今年3 月,OpenAI 曾宣佈為GPT-4 提供類似的影像辨識功能,但最初並沒有廣泛提供這些功能。這讓Google有機會在 OpenAI 發布之前,透過Gemini發布一套廣泛的多模態模式。
Google還有一個秘密武器:YouTube。兩位熟知內情的人士說,Google研究人員在很大程度上依賴Google擁有的串流媒體服務,這些資料包括圖像、視訊和音訊字幕文本,對於訓練人工智慧模型非常寶貴。
這讓Google獲得了比OpenAI和AI圖像新創公司Midjourney等競爭對手豐富得多的資訊庫。這些人說,這也意味著Google必須滿足法律部門的要求,例如確保如果YouTube用戶刪除了視頻,Google也會從其模型使用的資料集中刪除該內容。
Google的另一個優勢是運算能力,與依賴微軟伺服器的OpenAI 不同,Google擁有自己的資料中心。為了更有效率地運行軟體,Google甚至打造了自己的專用人工智慧晶片——張量處理單元(TPU)。 Google為 Gemini計畫累積了數量驚人的晶片–7.7 萬個代號為Pufferfish的第四代張量處理單元。第三季度,Google未分配的企業成本(包括在 DeepMind 上的支出)激增近 40%,達到16億美元。
當倫敦的員工結束一天的工作,而山景城的員工開始一天的工作時,Gemini的領導者透過每天與監督專案部分工作的員工舉行會議,隨時了解研究人員的進度。一位人士說,主持會議的有Dean、Vinyals和研究副總裁Koray Kavukcuoglu。
高階主管也在戰壕工作,Dean率先改進軟體,幫助公司的演算法處理大量資料。聯合創始人Sergey Brin曾因辦公室戀情醜聞而與Google保持距離,但他在山景城與Gemini研究人員並肩工作,並定期在公司食堂與他們共進午餐。
一路上也有一些尷尬的時刻,在今年 2 月為 Bard 公司做的一次演示中,聊天機器人在詹姆斯-韋伯太空望遠鏡的問題上犯了一個事實錯誤,這讓正努力追趕 OpenAI 的Google十分尷尬。兩天后,當這個錯誤廣為人知時,Google股價下跌了 9%。
今年 5 月,Google在年度開發者大會上的演講中首次披露了Gemini的存在,華爾街對此印象深刻:公司股價當天躍升了 4% 以上。
蓄力赶超
在接下來的幾個月裡,Google逐漸接近發布 Gemini,9 月Google讓一些開發人員使用了較小版本的Gemini進行測試。
但就在同一個月,OpenAI推出了GPT-4 with Vision,在多模態功能上擊敗了Google,這也為其技術帶來了更多的關注,同時也帶來了新的業務。一位與該團隊關係密切的人士說,消費者對 Bard 的使用讓團隊內部的一些高階主管感到失望。就在微軟宣布其 Azure 雲端運算部門營收成長 29%,令人印象深刻的同一天,Google在10月揭露其雲端運算部門第三季營收成長乏力,僅 22%。這只會增加Gemini團隊的壓力,迫使他們拿出大手筆。
然後,大約在11月,在對新產品進行行政審查時,本應與GPT-4 競爭的最先進的Gemini模型在英語以外的語言中難以正常工作。
讓Google稍感安心的是,OpenAI 也在處理自己的問題。 2023 年中期OpenAI廢棄了一個名為 Arrakis 的重要新模型,因為它在訓練中表現不佳。 11月底,OpenAI 董事會解雇了執行長Sam Altman,OpenAI 幾乎崩潰。 Altman在這事件後重返OpenAI,似乎暫時穩住了這艘船。
最後,在12月初,Google拉開了 Gemini 的帷幕。它公佈的測試結果顯示,性能最強的版本 Gemini Ultra 在多項行業標準基準測試中的表現優於 GPT-4,儘管許多研究人員對這些說法提出了質疑。 Google公司自己也承認,該影片誇大了Gemini的功能。該影片的發布讓公司一些事先沒有看過影片的普通員工感到沮喪,但一連串的聲明傳遞了一個強烈的訊息:Google已經做好了競爭的準備。
一位高層甚至發起了攻勢,抨擊微軟依賴 OpenAI 開發其尖端技術。 Google和Alphabet 全球事務總裁Kent Walker在新聞媒體 Semafor 舉辦的活動上說,公司不相信「外包」人工智慧開發。
現在,Google面臨的考驗是將Gemini到各個產品應用中,就像微軟對 OpenAI 技術所做的那樣。但Google有一個對手不具備的優勢:Pixel 硬體設備組合,包括手機、手錶和耳塞,都能從人工智慧中受益。其中一個版本的 Gemini 就是專門為在 Pixel 手機上運作而設計的,Pixel手機使用的是Google訂製的人工智慧晶片。
在科技公司競相將自己的硬體與新的人工智慧功能整合在一起的時候,Pixel設備專用的人工智慧助理的推出可能會促進Google硬體業務的發展。據一位知情人士透露,Pixie 將使用客戶手機上的信息,包括來自Google地圖和 Gmail 等產品的數據,進化成更個人化的Google助理。這位知情人士稱,該功能最快將於明年在Pixel 9和9 Pro上推出。
最終,Google希望把這項功能帶到普通手機和手錶等設備上,該公司將需要越來越先進的機型來支援其所有的產品理念。不過,Google似乎正在抓緊時間,確保自己不會再陷入困境。據一位熟知內情的人士透露,Google已經在訓練下一代大模型Gemini 2。