誰能先「甩」了英偉達
OpenAI也在騎驢子找馬,想要盡快擺脫對英偉達的依賴。根據路透社,至少從去年開始,OpenAI就已經討論了各種方案,希望能解決晶片又貴又短缺的問題。其中,自研晶片是方案之一,目前這個方案仍然沒有被完全否定。
另一個方案是直接收購一家晶片公司。知情人士表示OpenAI已經有潛在的收購目標,並曾考慮對其進行盡職調查。但報道中未能確定具體是哪家晶片公司。
巧合的是,另一個消息與之相伴而出——微軟將在下個月的年度開發者大會上,推出其首款為AI設計的晶片「雅典娜(Athena)」。
根據The Information引述知情人士,雅典娜將用於資料中心伺服器,為訓練大語言模型等設計,同時支援推理,能為ChatGPT背後的所有AI軟體提供動力。
雲端已經成為大模型的重要戰場,而微軟在該領域的兩個競爭對手Google和亞馬遜,都早已擁有了自己的AI晶片。雅典娜的推出將讓微軟補全短板。
微軟和OpenAI在晶片問題上的進展頗有代表意義:論角色,正是微軟、OpenAI和英偉達的三方聯手,讓ChatGPT變為現實,繼而引發了一場全球性的AIGC新浪潮;論時間,下個月正是ChatGPT推出一整年的節點。
大模型競爭的下一個焦點似乎是“誰能先’甩’了英偉達”,在晶片領域具備統治力的英偉達,已經成了一種亟需擺脫的束縛。
2016年,成立僅一年的OpenAI迎來一位貴客,英偉達CEO黃仁勳。他親自將首個輕量化小型超算DGX-1送給了OpenAI,OpenAI一年的計算量可以靠DGX-1在一個月內完成。
如今,後知後覺的人們回頭看黃仁勳在DGX-1上的簽字“為了計算和人類的未來”,驚呼“皮衣教主”的毒辣眼光。
到了2019年,微軟牽手OpenAI,為其打造的超級電腦用上了上萬個英偉達A100 GPU。就這樣,OpenAI出力、微軟出錢、英偉達出基建,用驚人的算力支撐著OpenAI大模型的研發,並最終大力出奇蹟,ChatGPT於2022年11月推出,驚艷世界。
OpenAI成為明星企業,微軟以AI策略與Google等展開激烈廝殺,而英偉達公司市值更是從去年11月的3000多億美元,飆升到如今的超萬億美元。全球掀起大模型熱,英偉達作為“賣水翁”,晶片不愁賣。
今年7月,花旗研究分析師Christopher Danely在一份報告中指出,英偉達將佔據AI晶片市場「至少90%」的市佔率。
然而,這場「三贏」的遊戲中,卻可能只有黃仁勳是全然快樂的。對於微軟和OpenAI為代表的「買水人」來說,依賴英偉達的晶片至少有兩個問題。
第一個問題是貴。對於OpenAI搭建的超算,根據彭博社報道,微軟在該專案上的花費了數億美元。伯恩斯坦研究公司分析師Stacy Rasgon分析,ChatGPT每次查詢都要花費約4美分。如果ChatGPT的查詢量規模成長到Google搜尋的十分之一,則需要約481億美元的GPU,並且每年還需要160億美元的晶片才能維持運作。
第二個問題是稀缺。就在今年6月,OpenAI CEO阿爾特曼(Sam Altman)在一次會議上聲稱,晶片的短缺阻礙了ChatGPT的發展。面對客戶對API可靠性和速度的抱怨,阿爾特曼解釋大部分問題都是由於晶片短缺造成的。
今年新發表的英偉達H100是目前最熱門的AI晶片,但只能滿足一半的市場需求。英偉達H100和A100均由台積電生產,台積電董事長劉德音上個月曾解釋稱,供應限制不是由於缺少實體晶片,而是先進晶片封裝服務(CoWos)的產能有限,而這是製造過程的關鍵步驟。
劉德音也預計,一年半後技術產能將足以滿足客戶需求,也就是2024年底AI晶片供應緊張可能會得到緩解。
雖然雅典娜可能在今年才會推出,但微軟已經為此準備好多年。在豪擲數億美元為OpenAI打造超算的2019年,微軟的雅典娜計畫已經啟動。根據爆料,雅典娜會使用台積電5nm製程打造,直接對標英偉達A100,預計每顆成本降低三分之一。
對英偉達來說,微軟和OpenAI的私心是一個紅色訊號。
微軟是英偉達最大的客戶之一,甚至傳出「包圓」H100全年產能的消息,OpenAI則是AIGC領域最重要的風向標。二者自研晶片的心,是英偉達頭頂的一抹烏雲。
Google曾是最早大規模採購GPU來進行AI運算的公司,但後來研發自己的AI專用晶片。在2016年就已經發布了第一代TPU(張量處理單元),隨後在2017年作為Google Cloud基礎架構Google TPU推出。這些年來Google一直在持續迭代,今年4月其公佈了TPU v4的細節,稱其比英偉達的A100強1.7倍。
雖然Google仍在大量採購英偉達GPU,但其雲端服務已經用上了自家的TPU。在這次的AIGC大戰中,AI繪圖公司Midjourney、有ChatGPT競品Cloude的獨角獸公司Anthropic,都不是像OpenAI一樣從英偉達採購晶片搭建超算,而是使用了Google的算力。
另一個科技巨頭亞馬遜也動作頗早,在2015年收購以色列晶片新創公司Annapurna Labs,為其雲端基礎設施開發客製化晶片,三年後推出了基於Arm的伺服器晶片Graviton。後來,亞馬遜推出以人工智慧為重點的晶片Inferentia, Trainium。
上個月,消息稱亞馬遜將向Anthropic投資40億美元,作為交易的一部分,Anthropic 將使用AWS Trainium 和Inferentia 晶片來建造、訓練和部署其未來的基礎模型。
除此之外,英偉達的其他競爭對手也在向AI晶片領域發動攻擊。AMD、英特爾、IBM等正陸續推出AI晶片,試圖與英偉達的產品抗衡。今年6月,AMD發表了Instinct MI300,直接對標英偉達H100,是專門針對AIGC的加速器。其整合的電晶體數量達1530億,高於H100的800億,是AMD投產以來最大的晶片。AMD甚至用相容英偉達CUDA的策略,降低顧客的移轉門檻。
不可否認的是,目前英偉達仍幾乎壟斷AI晶片市場,沒有競爭對手撼動其地位,也沒有科技巨頭可以完全擺脫對它的依賴。
但「降低英偉達的控制力」似乎成為一種共識,外部挑戰一浪接著一浪。微軟和OpenAI自研晶片的消息,就是新的一浪。英偉達能穩站岸頭嗎?