強攻AI叫板英偉達AMD突圍算力芯片大戰
算力江湖,硝煙四起。在生成式AI和大模型浪潮席捲全球之下,英偉達憑藉前瞻的戰略佈局、先進的產品組合和多年的生態積累,幾乎成為人工智能GPU的唯一選擇,因而推動其市值一度大幅上揚衝破萬億美元。儘管多家科技巨頭、初創公司紛紛加碼這一領域,但英偉達一直未棋逢對手。
但如今,英偉達或已無法高枕無憂。近日,AMD在美國舊金山舉辦的“數據中心和人工智能技術首映式”活動上,正式發布MI300系列在內的一系列AI和數據中心相關技術產品,其中包括直接對標英偉達旗艦產品H100的MI 300X,以及全球首款針對AI和HPC的加速處理器(APU)MI300A。這意味著AMD將在人工智能領域與英偉達“正面剛”。
在業界看來,硬剛英偉達,AMD無疑在獲取客戶,數據和庫、硬件加速和生態建設等方面面臨重要挑戰,以及在當前的行業發展和競爭格局下,其尚未公佈的定價將成為戰略重點。但在旺盛的市場需求和科技巨頭多元佈局戰略下,AMD MI 300X憑藉性能優勢以及系列相關建構升級,勢必將成為AI市場的有力競爭者,以及英偉達高端GPU的重要替代產品。
硬剛競品力創新機
隨著AI浪潮席捲全球,AMD已將發展人工智能列為核心戰略,在技術創新高地保持強力攻勢,並於近日推出了新一代AI芯片、數據中心CPU以及預告將推出全新DPU芯片。顯然,其中最受矚目的莫過於用於訓練大模型的AI芯片Instinct MI 300X,直接對標英偉高端GPU H100。至於另一款同期發布的MI300A,號稱全球首款針對AI和HPC的APU,以及業界首款“CPU+GPU+HBM顯存”一體化的數據中心芯片。
一些分析機構和行業人士研判認為,MI300X性能強大,是對標英偉達高端加速卡的有力競品。相較H100,MI300X在晶體管數量和顯存容量上亦大幅領先。而MI300A憑藉CPU+GPU的能力,產品組合性能更高、同時具有成本優勢。另外,在收購賽靈思之後,AMD在加速卡領域的定制化服務大幅領先英偉達,能夠協助雲廠商在特定算法模塊上進行訓練。
隨著下游應用端的高速發展,使得微軟、Google、Meta等眾多海外巨頭爭相增加算力儲備,算力芯片需求高度旺盛之下,英偉達一家獨大的市場格局或將迎來轉變。
但有所遺憾的是,AMD股價在發布會活動過程中轉而走低,收跌3.61%。而同行英偉達則收漲3.90%,市值再次收於1萬億美元關口上方。在投資人眼裡,AMD的所謂“超級芯片”MI300X似乎仍然難以撼動英偉達的根基。其中,TIRIAS Research首席分析師Kevin Krewell表示:“我認為,沒有(大客戶)表示將使用MI300X或MI300A,這可能會讓華爾街感到失望。他們希望AMD宣布已經在某些設計方面取代了英偉達。”
目前,AMD公佈的客戶僅有開源大模型獨角獸Hugging Face,以及更早之前透露的勞倫斯利弗莫爾國家實驗室。雖然兩者與對大模型和數據中心芯片有更大需求的科技巨頭不在一個數量級,但在AMD的發布會上值得注意的是,亞馬遜旗下云計算部門AWS、甲骨文云、Meta、微軟Azure的高管均來到現場。其參會動機一定程度上不言而明。
此後,由於傳出亞馬遜正在考慮使用MI300人工智能芯片,AMD股價隨即上漲約1%。Insider Intelligence分析師Jacob Bourne表示:“亞馬遜正在考慮AMD的MI300,這一事實表明科技公司有意使其AI開發硬件多樣化,這可能會為其他芯片製造商創造新的機會。”
美國科技類評論家Billy Duberstein也指出,潛在客戶對MI300非常感興趣,正在強烈要求尋找英偉達的替代產品。鑑於目前英偉達H100的服務器價格高昂,數據中心運營商希望看到有一個第三方競爭對手,這有助於降低AI芯片的價格。因此,這對AMD而言是一個巨大的優勢,對英偉達來說則是一個挑戰。這能為每個市場參與者帶來良好的盈利能力。
尚有軟肋定價是“金”
從產品性能來看,AMD MI 300X已在業界力拔頭籌,包括支持達192GB的HBM3內存(是英偉達H100的2.4倍),HBM內存帶寬達5.2TB/s(是英偉達H100的1.6倍),Infinity Fabric總線帶寬為896GB/s,晶體管數量達到1530億個,遠高英偉達H100的800億個。但AMD並沒有公佈這款GPU的價格,使得“雙雄”競爭增加了懸念。
AMD MI 300處理器
業界分析稱,AMD並沒有透露新款AI芯片的具體售價,但想要有顯著的成本優勢可能不太現實,因為高密度的HBM價格昂貴。即便MI300X的內存達到了192GB,但這也不是顯著優勢,因為英偉達也擁有相同內存規格的產品。
對此,Cambrian-AI Research LLC創始人兼首席分析師Karl Freund也在福布斯網站上發文表示,雖然MI300X芯片提供了192GB內存,但英偉達在這一點上將很快迎頭趕上,甚至在相同的時間框架內可能實現反超,所以這並不是一個很大的優勢。而且MI300X的售價將會十分高昂,與英偉達的H100相比不會有明顯的成本優勢。
另據晚點LatePost援引一位AI從業者的話報導稱,他所在的公司曾接觸一家非英偉達GPU廠商,對方的芯片和服務報價比英偉達更低,也承諾提供更及時的服務。但他們判斷使用其它GPU的整體訓練和開發成本會高於英偉達,還得承擔結果的不確定性和花更多時間。
“雖然A100價格貴,但其實用起來是最便宜的。”他說,對有意抓住大模型機會的大型科技公司和頭部創業公司來說,錢往往不是問題,時間才是更寶貴的資源。
不難猜測,這家非“英偉達GPU廠商”是AMD的可能性極高。由此,在AI浪潮下,爭市場還是保盈利,將成為MI 300X屆時定價的戰略重點。但除了價格,AMD勢必也面臨其它各類挑戰。
Karl Freund認為,雖然AMD新推出的MI 300X芯片激起了市場各方的巨大興趣,但與英偉達的H100芯片相比面臨的一些挑戰包括,英偉達的H100現在已開始全面出貨,而且到目前為止仍擁有AI行業最大的軟件和研究人員生態系統。然而,AMD尚未披露任何基準測試,也還沒有上市(預計今年第四季度量產)。另外,訓練和運行大語言模型(LLM)時的性能取決於系統設計和GPU,MI 300X正式推出時才能看到一些詳細比較。
至於真正關鍵的地方,Karl Freund指出,MI300X並不具備H100所擁有的Transformer Engine(一個用於在英偉達GPU上加速Transformer模型的庫)。基於此,H100可以將大模型的性能提高兩倍。如果用幾千個(英偉達的)GPU來訓練一個新模型需要一年的時間,那麼用AMD的硬件來訓練可能需要再等2-3年,或者投入3倍的GPU來解決問題。
可即便如此,市場也不願意英偉達以高溢價壟斷市場。美國投行TD Cowen在一份報告中指出,“隨著市場尋找人工智能市場領軍企業英偉達的替代品,AMD成為日益明顯的選擇。”僅憑這一點,就足以讓科技巨頭保持對這家公司的高度興趣。正因如此,資本市場對於AMD給予更多積極的預期。部分行業分析預測,AMD2024年AI相關營收有望達到4億美元,最高甚至可能達到12億美元——是此前預期的12倍之多。
生態大戰前程可期
毋庸置疑,與英偉達的H100相比,MI300X也面臨著多種挑戰和一定劣勢。華泰證券表示,AMD對英偉達市場份額的挑戰並非能一蹴而就。一方面,英偉達GPU芯片的算力壁壘以及AI訓練端的深入佈局一時難以撼動,另一方面,AMD的軟件生態也限制其與客戶系統的融合及滲透應用場景。
可以說,英偉達的領先地位不僅來自於其芯片,還來自於十多年來為人工智能研究人員提供的軟件工具。Moor Insights & Strategy分析師Anshel Sag稱:“即使AMD在硬件性能方面具有競爭力,但人們仍然不相信其軟件解決方案能與英偉達競爭。”
進一步來看,軟件生態也被多位行業人士視為英偉達銅牆鐵壁一般的護城河。
據悉,英偉達於2007年發布CUDA生態系統。通過使用CUDA,開發者可以將英偉達的GPU用於通用的計算處理,而非僅限於圖形處理。CUDA提供了一個直觀的編程接口,允許開發者更容易使用C,C++,Python,以及其他一些語言來編寫並行代碼。2023年,CUDA的開發者已達400萬,包括Adobe等大型企業客戶。而用戶越多構成的生態粘性就越大。
相比之下,AMD在2016年推出了ROCm,目標是建立可替代英偉達CUDA的生態。在發布MI300X等產品時,AMD也展示該公司不斷優化ROCm的努力和部分成果。有行業分析稱,這會對CUDA有一定影響,但是CUDA有自己護城河,比如其和硬件層面非常貼合,還有Compile tool,Soft stake等很多層級的生態以及一些先天優勢。
“但CUDA的護城河已經不是那麼絕對,因為客戶的上層模型參數可以不做任何調整直接從英偉達的卡遷移到AMD上。ROCm能兼容每一個層級Soft stake,也能在保持穩定性同時提升性能。很多客戶不想被英偉達深度綁定,所以會選擇AMD。因此,CUDA現在已經不像之前那樣堅不可摧。”
上述行業人士還指出,CUDA會持續迭代,而如果AMD一直只是做兼容就需要一直緊跟英偉達,一旦跟不上就會很吃虧。長期來看,這對企業而言肯定不少好事情,需要構建自己的長期系統生態,包括與客戶合作開發Soft stake,軟件,Rocm數據和庫,基於AMD MI硬件做加速等。這是AMD需要長期做的事。
客觀而言,與CUDA相比,ROCm在各項投入、技術積累和生態構建等方面還存在一定差距。華泰證券的研究報告稱:“目前ROCm的不足之處在於操作系統長期只支持Linux,最近才登陸Windows;加上長期只支持高端GPU,如Radeon Pro系列等,直到今年4月才擴展至一些消費級GPU;另外,CUDA在今年達400萬以上的開發者,也是ROCm無法相比的地方。”
與此同時,報告也指出,AMD目前也正積極拓展ROCm生態圈,包括支持Windows操作系統、在AI領域開拓更廣泛的框架,如MIOpen和MIVisionX,以及支持TensorFlow、PyTorch等更多軟件。此外,ROCm在進一步通過HIP兼容CUDA同時,也與包括微軟在內的客戶等合作重構自己的生態。而這勢必將對英偉達AI芯片的王座形成更強有力挑戰。