谷歌CEO最新訪談:AI要打持久戰量子運算突破令人興奮
本週,GoogleCEO桑達爾·皮查伊(Sundar Pichai)度過了他幾年來最美好的一周。因為Google取得了一系列大大小小的勝利,從諾貝爾獎頒獎典禮,到突破性的新AI模型Gemini 2.0,再到量子計算的突破。日前,美國新銳媒體Semafor科技編輯里德·阿爾伯戈蒂(Reed Albergotti)在山景城採訪了皮查伊。今年是皮查伊擔任GoogleCEO的第十個年頭,無論是在壓力之下,還是被勝利所圍繞,他總是能保持平穩。
自2022年11月ChatGPT發布以來,Google的發展一直很坎坷,至少從外部來看是如此。傳統觀點認為,Google不知何故錯過了ChatGPT時刻,感到恐慌。但皮查伊表示,他從未懷疑過公司的長期計劃,選擇堅持到底,打持久戰。
皮查伊也表示,當唐納德·川普(Donald Trump)明年入主白宮時,他將積極參與美國新政府的AI「曼哈頓計畫」。
以下為訪談內容摘要:
Q:對Google而言,這是一個十分瘋狂的一周,所有的產品公告,量子計算突破,諾貝爾獎,還有新AI模型Gemini 2.0。這都是你們計畫好的嗎,還是因為AI的瘋狂所導致的?
皮查伊: 2015年,我讓公司朝著AI優先的方向發展。作為其中的一部分,我們表示,將從世界級的研究開始,對AI進行深入、全端的研究,建立基礎設施。然後為我們開發人員建立模型,並將其放入我們的產品中。這種深度投資貫穿了我們作為一家公司、Google和Alphabet所做的一切。這是基礎,採取深度技術創新方法,全端方法。然後在當前的生成式AI時代,有時你會投資提前做好事情。對我來說,這就是從頭開始建立GoogleDeepMind,啟動Gemini,並將其構建為原生多模式和長上下文,現在進入2.0版本。
所以,要打好基礎,調整團隊,建立公司。我想你已經看到了所有這些裨益已經開始提供給消費者了。我預期我們的速度會更快,因為總是有固定的成本。我們必須大規模地準備我們的TPU,以建立我們想要建立的模型,建立我們的資料中心,組建合適的團隊。創新管道感覺非常非常強大。其中一些是長期賭注,需要時間來完成。在我看來,量子計算就像AI在2010年左右的樣子。很少有人知道這件事,但你正在有條不紊地處理它。這是一樣的。至於Waymo,我們已經走過了15的歷史,這是一個激動人心的時刻,所以這可能是所有這些子的結合。諾貝爾獎不是計劃好的,但當它發生時我說了這句話:我覺得看著Demis Hassabis和John Jumper(榮獲2024年諾貝爾化學獎),他們的團隊,以及在AlphaFold上的工作,我很榮幸從頭到尾都能看到諾貝爾獎的作品。所以這是錦上添花。
Q:一兩年前,人們的說法是,Google被ChatGPT打得措手不及。而本周是一個很好的時機,看看你在公司方面取得了多大的進步,以及人們對谷歌的看法。你現在感覺不一樣了嗎?
皮查伊:這是一個令人興奮的時刻。在內部,我明顯感覺到我們正在取得的進步。當你在研究AI模型時,你會看到所有這些損失曲線(loss curve),以及模型的能力。有各種基準做證。我們擁有世界級的人才,可以獲得最先進的資源。谷歌DeepMind和Google研究(Google Research)的結合,是目前生成式AI領域被引用最多的。我們將對這場革命正在發生的許多突破負責。看到這種勢頭,我們肯定非常滿意。但我們計劃做得更多,這才剛開始。
Q:你上週在《紐約時報》DealBook會議上說,AI進展越來越難,低垂的果實已經拿下來了。這到底是什麼意思?被摘下的低垂的水果是什麼?那真正困難的是什麼?
皮查伊:為了明確我的答案,我在那裡說了。事實上,我對未來的進展感到非常興奮。我的意思是,我認為在這個領域,你可以投入計算,並取得初步進展。但是,這不僅僅是一個擴大規模的問題,而是實現突破。因此,讓我們的模型使用多達200萬個令牌作為輸入長度,這就是長上下文。這是一個突破的例子。使用Gemini 2.0,我們有一個多模式即時API,所以現在它可以進行本地映像和音訊輸出。它支援串流,讓使用者即時看到模型的輸出,而不是等到整個回應生成完成。這些都是突破。當我們進入下一個階段時,你需要更有洞察力的突破。我認為,這項工作的品質將相當高。我想說的是,我認為這將有助於區分真正的精英團隊。不只是我們,還有其他幾個團隊,這會讓2025年更令人興奮。
問:我明白了,是人們理解錯了。外在的理解是,你們的發展已經進入了平穩期,甚至是停滯期。但你的意思是,在谷歌,當事情變得艱難時,反而會大放異彩?
皮查伊:沒錯。 Waymo也是一樣。許多人都在努力解決這個問題,但後來變得更難了。當它變得更難時,能夠克服它,達到下一個水平,這很重要。
Q:人們傾向於將過去兩年的發展視為曲線。如果這樣看,確實像我們正在達到一個平穩期。如果你縮小視野,看看那條曲線,我想你看到的路上會有一些停滯。你認為它會從這裡走向何方?這是同一條軌跡嗎?
皮查伊:我仍然清楚記得2010年左右,我剛剛意識到這個模型幾乎無法辨識影像,並對此感到興奮。在過去的十年裡,進步是無情的。現在,它無疑將更廣泛的公眾擴展到了這個領域,所以它是主流。但當我展望2025年時,我肯定認為我們現在已經有了足夠的功能模型,我們可以在其上建立許多用例。
這一進展將是非常真實的。有了Gemini 2.0,我們正在為它更具代理性奠定基礎。雖然它仍在研究範圍內,但我們將它交給值得信賴的測試人員,例如Project Mariner,從一開始就在Chrome上工作。看到一個模型能夠使用瀏覽器是非常不可思議的,但我們必須突破一些障礙,因為我們在這些領域必須安全、可靠地做到這一點。俗話說,「最後的20%需要80%的努力。」在這種情況下,最後10%可能需要90%的努力。但這就是為什麼我們要有基準。我們正在取得進展。我們正在把它交給值得信賴的測試人員。這樣我們就可以負責任地進行測試,獲得回饋,然後將其提供給更多的人,等等。但想想AI可以開始影響世界上的所有工作流程。我們實際上可能會看到比我們所看到的更大的進步。兩者同時為真。
Q:說到長期策略,從一開始就與Gemini進行多模式合作似乎犧牲了一些其他能力(也許是在語言和編碼方面),是這樣嗎?
皮查伊:當我們推出Gemini 1.2時,我們真的希望它從一開始就是多模式的。我認為我們的模型在多模態方面幾乎是最先進的,但我們還沒有展示出模型的能力。沒有本地影像輸出或音訊輸出。在2.0版本中,我們正在解鎖這些功能,但同時,我們在所有編碼或推理等方面都變得最先進。在SWE基準下,我們的模型現在是最先進的。我們還有其他尚未發布的實驗模型,這些模型顯示了更多的功能。我們肯定在推動前沿,但我們會負責任地做到這一點,這就是為什麼你會看到其中一些處於可信的測試模式,其中一些僅作為開發人員的實驗API,但我們將努力工作,獲得回饋,然後將其提升到一個新的水平。
問:DeepMind的人說了這一點,並提出理論,認為多模型方法是通往AGI的道路,因為你需要有這個世界模型,也許你需要有一個具體的AI,才能真正推理和理解。隨著你的進步,你發現這是真的嗎?你認為這是正確的方法嗎?
皮查伊:身為人類,我們與世界的經驗是令人難以置信的多模式的,所以它總是有意義的。這就是為什麼我們使用Google Lens進行搜尋。如果你能把手機指向你正在看的東西並問問題,你就不應該總是打字。 Lens每月為我們帶來數十億次查詢,這是我們成長最快的用例之一。我一直很清楚,這就是未來的發展方向。 Demis和他的團隊,一直有著強烈的願景。作為這一切的一部分,我們推出的一件事是,你可以用它來幫助遊戲。如果你是新玩家,它會關注你在做什麼,並與你交談以提供回饋。我認為這是它的基礎。從長遠來看,當你看到機器人技術之類的東西時,這將是非常重要的,尤其是對於Waymo。 Waymo就是看著周圍的世界並做出決定。我們正在使用這些原生多模式模型進行的工作將與Waymo相交,並隨著時間的推移使Waymo變得更好。
Q:當你把這些多模式產品交到數十億人手中,看看Astra,當它廣泛可用時,它真的成為一個很好的訓練資料來源嗎?這對谷歌來說是一個優勢嗎?
皮查伊:在我們所做的一切中,沒有什麼比真實世界的回饋更好的了。人們在搜尋中使用Google Lens,人們在使用Astra。我認為良性循環對我們的產品來說變得非常重要。我認為這一切都讓我們的產品變得更好。例如,如果你看看Waymo,我們模擬了很多,然後我們在現實世界中開車。但現在我們在現實世界中,部署在城市中,每週提供17.5萬次出行服務,約100萬英里。我認為這是你創造性地改進產品的最佳方式。
問:明年有10座城市,很快。你認為這會成為真正的收入來源嗎?標準是什麼?按每英里收費嗎?
皮查伊:我們現在的衡量標準是確保我們正在建立一個通用的Waymo駕駛程式。我們可以採取的情況越多,規模就越大,使其在城市環境、高速公路和所有天氣條件下都能以很高的標準安全工作。然後在各種場景中交付它(在我們的汽車中,與合作夥伴合作,就像他們與Uber或其他參與者的合作一樣),讓它擴大規模,擁有良好的用戶體驗是我們在努力解決這個問題時所考慮的。
Q:有一件事我沒想到會發生,那就是資料中心的名字,像是Colossus、Rainier。你在堪薩斯城有一個價值數十億美元的資料中心。你是打算建立一個這樣的大型集群,還是已經建立了?會有名字嗎?
皮查伊:從現在開始,我們應該讓Gemini接管我們的命名。我們一直在推動資料中心的最新技術,我認為我們有一些世界上最強大的叢集。我感到自豪的是,世界上大部分地區都在採用液體冷卻。我們在資料中心廣泛部署液體冷卻已經有一段時間了。我們將成為首批客戶之一,不僅是TPU,還將與英偉達合作,在我們的資料中心獲得GB200。我們已經有一個部分由地熱驅動的資料中心。我們的頂級資料中心,其中許多在能源使用方面都是90%無碳的。所以我們處於領先地位,我們正在擴大規模。我所看到的一切,我們所製定基準的一切,我認為我們也處於前沿。
問:但你不會像其他人一樣談論它。亞馬遜宣布要部署數十萬個他們的Trainium2晶片。你在TPU上訓練了Gemini 2.0,為什麼不出去吹噓一下呢?
皮查伊:我記得在2017年或2018年的GoogleIO上,我談到了建立AI優先的資料中心,並展示了我們的TPU元件。也許我們已經做了一段時間了。我們為我們所做的事情感到自豪,但我會接受你的建議,並確保我們更多地討論它。
Q:也許這是商業機密;也許如果你處於領先地位,你就不必談論它。你能把這些被認為是世界上最大的集群中的一些進行比較嗎?
皮查伊:需要明確的是,有幾家公司在做這件事。重要的是,為了產生用於預培訓的尖端模型,你需要這些大型集群,理想情況下是同時定位的。我們在這方面絕對處於領先地位。我認為我們有一些最大的計算集群可供GoogleDeepMind和我們的雲端客戶使用。我們將在那裡做得更多。
問:即將上任的川普政府提出了AI的「曼哈頓計畫」。你對這會是什麼樣子以及Alphabet將在其中扮演什麼角色有什麼見解嗎?
皮查伊:現在還為時過早。過渡團隊正在那裡進行,但總統非常明確地表示,他希望投資於技術領導和關鍵技術。在我看來,多年來我們一直這樣做,但我們想提供幫助。你看到了我們關於量子計算或AI的公告,我們宣布了與合作夥伴一起建造小型模組化核反應器的團隊。其中一些是大型的實體基礎設施項目。我認為我們有機會作為一個國家共同努力,實施這些雄心勃勃的大型項目,並回到那個階段。世界上沒有人對看到SpaceX助推器以這種方式返回並著陸不感興趣。我認為設定一個高標準,追求這些大型的實體基礎設施項目,並把它做得又好又快。稅率的進步是我們非常興奮的事情,我們很樂意盡我們所能發揮作用。
Q:你和新的AI沙皇談過了嗎?
皮查伊:還沒有,但我期待與David Sacks會面。很明顯,會有一些人走進來,他們是這些領域的技術專家。我認為這將非常非常有幫助。我們期待著參與其中。
問:所以還沒有具體細節,你不知道那會是什麼樣子?
皮查伊:是的。除了早期跡象表明他們肯定有興趣推動大規模創新。我們期待著這些對話。
Q:你們的量子AI團隊在糾錯方面取得了重大突破。你預料到了嗎?你的反應是什麼?
皮查伊:令人興奮的事情之一是我們的量子團隊,與Hartmut Neven和團隊一起,他們一直有一個非常嚴格的框架,他們在這一明確的里程碑中定義了進展。每次我們有一個里程碑,我都覺得,這些都是雄心勃勃的計畫。這無疑是最正面的驚喜之一。這絕對是一個更深層的突破,在量子電腦中擴展時解決了糾錯問題。這無疑是該領域最嚴峻的挑戰之一。我對此非常滿意。但對我們來說,這些都是我們專注於開發實用量子電腦的里程碑,我們可以將其應用於新的新穎應用案例。這就是目標。這與我們的Waymo或AI旅程相似,都需要時間。但我認為,如果你下定決心,進步是不可避免的。
問:你說量子就像2010年的AI。這意味著它很快就會開始產生真正的影響。實現大規模量子電腦對Alphabet意味著什麼?
皮查伊:對於你之前的問題,經典計算或超級電腦正變得越來越強大。但我認為,對於某些類型的用例,量子最終將發揮強大的作用。它將成為我們武器庫中的重要工具。未來,量子和AI的交叉對我們來說非常令人興奮。我們與GenCast一起發布了最先進的天氣預報模型。但在未來,當我們可以使用量子運算時,你不應該低估我們在更深入、更好的尺度上預測這些事情的能力。這些都具有深遠的實際意義。有些事情,例如AlphaFold所做的,你還能做些什麼來理解自然,模擬自然,所有這些都有實際應用。然後,無論是透過AI還是量子,我們都在更深入地了解我們所生活的宇宙的性質和結構。我認為這給了我們最好的機會,因為宇宙從根本上就是量子的。因此,取得進展也有更深層的影響。它不僅會改變世界,而且也有可能為許多其他項目提供支援。我的目標是,在五年的時間框架內,我們正在商業化地應用量子來解決一些用例,然後從那裡開始,你可以進一步發展。
問:你提到明年AI搜尋將是一件更大的事。 AI Overview(AI概述)對於我的許多搜尋已經變得非常有用。能更詳細地說明一下嗎?
皮查伊:我們對AI Overviews搜尋的發展感到非常興奮。我一直在使用Gemini 2.0 flash的AI概述,我已經看到了它的改進。這是我們將向更多人推廣的東西。但我們也會用它做更多的事情。我們的AI模型將幫助我們進行搜索,為更複雜、更深入的查詢建立體驗,在這些查詢中,你必須對其進行分解,幫助用戶迭代,並獲得更深入的答案。 2025年,我們肯定會迅速創新,搜尋將做2024年無法做到的事。這就是我為團隊設定的目標:2025年搜尋的一類問題比2024年明顯改善,我認為我們會實現這一目標。這很令人興奮,因為這意味著你正在推動知識和資訊的前沿。我期待著所有這些都能交到用戶手中。
Q:AI安全是很多人提出的另一個問題。 Demis說,也許一年前,隨著競爭的升溫,最大的風險之一是你開始從安全工作中拿走資源(弱化安全),因為你需要盡可能多的資源來贏得這場比賽。是這樣嗎,或是你能具體談談有多少人在從事安全工作,或是有多少運算資源嗎?有辦法衡量這一點嗎?
皮查伊:我們一直認為,這是一個推動創新的領域,但幫助你推動進步的是從一開始就納入安全。我認為,能夠長期思考和長期投資的優勢之一是,我們正在對這些模型的基礎安全性進行盡可能多的投資。這就是為什麼,例如,建構它的合成、開源方面,這些都是我們推動安全邊界的方式。隨著我們使這些模型更具代理性,我們都在投資安全框架。但我認為安全和創新是齊頭並進的。正是這一點幫助我們在Waymo取得了更大的進步。因為從第一天起,我們就將安全深深融入了我們的創新和發展實踐中,它們是相輔相成的。同樣,在AI領域,我們有比以前更多的人從事AI安全工作,包括訪問更多的計算。這是我們始終要堅持的事。
Q:關於反壟斷的一個問題很有趣。當我在Chrome上展示Mariner時,這就是美國政府想要迫使谷歌分拆的地方。如果你看看政府的任命,看起來這種情況不會消失。我只想問,沒有Chrome,Google會是什麼樣子?
皮查伊:這是一個重要的過程,我們將建設性地參與其中。我確實認為法官承認我們一直在創新,我們打造了最好的產品。我認為一些補救措施的範圍很廣。我們計劃提出強而有力的理由。你剛剛看到了創新的出現。所有這些都有利於消費者,歸根結底,這必須是基礎。這就是我們的法律所依據的。只要我們繼續堅持這種方法,為我們的用戶帶來有益的東西,我認為我們最終會做得很好。
問:你之前談到了地熱。我只是想知道在這方面是否有什麼讓你興奮的事情,什麼類型的能量會推動這一點?這會帶來新的再生能源創新嗎?
皮查伊:我們對太陽能的潛力知之甚少。有更多的機會擴大太陽能。從物理學和工程學的角度來看,我們有很多選擇。核能已經得到證實,有些國家已經證明了這一點,而且它今天仍然有效。我認為有更安全的選擇正在不斷研究中。地球內部也有這麼多的能量。我們只生活在地球表面,地球內部也有大量的能量,我們幾乎沒有利用。我一直覺得,如果你下定決心,我們應該要處理能源過剩的問題。能源應該是一種催化劑,而不是一種約束。阻礙我們前進的只有我們的想像和結果。
Q:我在看一張地熱潛在地點的地圖,它很大,覆蓋了整個美國西部。你們有一個(用地熱為資料中心供電),但它仍然很小,還不是千兆瓦,而是兆瓦。你們必須要深入挖掘嗎?
皮查伊:對能源的需求如此之大,我認為我們能夠滿足它。但我們需要更多的研發經費。我們需要更適當的許可才能真正進行這些工作。我認為這是新政府真正有機會的領域。他們已經表示,他們致力於實現這一目標。這是我們都可以有很大進步的事情。