AMD發起AI芯片挑戰但英偉達依然獨孤求敗

2023-06-15 Comments 0 Comment

英偉達CEO黃仁勳正在試圖給行業建立一種印象——AI等於英偉達。在AI大語言模型爆發的今天，要想完成對算力要求極高的AI訓練，英偉達針對人工智能的GPU芯片幾乎是唯一的選擇。這種供需的極度不平衡讓英偉達的GPU一芯難求，就連OpenAI CEO山姆·奧爾特曼也在抱怨芯片短缺已經影響到了ChatGPT的發展。

作者｜趙健

黃仁勳對此一定喜聞樂見。2023年，在AI需求的推動下，英偉達的市值衝破萬億美元。

不過，有人正在試圖打破英偉達在人工智能領域“獨孤求敗”的狀態。

本週三，AMD（超威半導體）在其首次“人工智能與數據中心”產品發布會上，正式發布了年度旗艦芯片Instinct MI300，一款可以對標英偉達Grace Hopper系列的超級芯片。

Instinct MI300有兩個版本：MI300X僅有GPU，專為AI模型訓練設計，封裝了1530億顆晶體管；MI300A則是集多個CPU、GPU和高寬帶內存於一身的APU（AMD在2011年時提出的產品概念），封裝了1460億顆晶體管。

Instinct MI300的發布意味著，英偉達不再是AI公司對算力的唯一選項。AMD確實也成功吸引到了一些AI明星獨角獸，比如Hugging Face，AMD將為其CPU、GPU和其他AI硬件優化模型。

Instinct MI300承載著AMD在人工智能領域的野心。AMD CEO蘇姿豐近期曾表示：“如果放眼五年，你會在AMD 的每一款產品中看到人工智能，它將成為最大的增長動力。”

AMD是英偉達的老對手，兩者在GPU市場的競爭已經持續了17年，大部分時間都以英偉達的勝利而告終。

而這一次，已經在CPU市場證明過一次的AMD，能否把成功經驗複製到GPU市場？

01 AMD想要英偉達的AI皇冠

AMD是全球知名的老牌半導體公司，成立於1969年。在今年Gartner發布的全球半導體公司的排名數據來看，AMD位列第七。

CPU是AMD的發家業務。1981年AMD獲得了英特爾X86系列處理器的授權，在PC時代的紅利期一舉做到了行業第二，而這個行業老二，一做就做了幾十年。

在CPU之外，AMD又通過不停地併購，逐步建立起“CPU+GPU+DPU+FPGA”完整的芯片佈局。

其中比較重要的併購事件包括：

2006年7月，AMD斥資54億美元收購當時的GPU行業老二ATI，正式與英偉達展開GPU的競爭；

2022年2月，AMD斥資498億美元完成對FPGA廠商賽靈思的收購，加強在數據中心業務的佈局；

2022年4月，AMD宣布以19億美元收購DPU芯片廠商Pensando，繼續擴大數據中心業務。

AMD的業務構成分為四大板塊：數據中心、客戶端、遊戲與嵌入式業務。

數據中心包含AMD所有的服務器相關的收入；客戶端收入主要涉及台式機與個人電腦，曾經是AMD最核心的業務之一，現在收入佔比已經不高；遊戲業務主要涉及GPU產品線，索尼、微軟是穩定的大客戶；嵌入式業務則主要來源於原賽靈思的業務。

隨著人工智能成為一種趨勢，數據中心成為各大雲巨頭高度重視、大力投入的業務，也是英偉達、英特爾與AMD的兵家必爭之地。

在此前的2023年Q1財報會上，AMD強調AI為目前公司的第一戰略重點，AMD正致力於構建更加多元的AI產品矩陣。

而AMD的產品發布會，就是首次以“人工智能與數據中心”為主題。蘇姿豐在發布會上強調，在大型語言模型的推動下，人工智能的市場機會越來越大，到2027年市場潛力可能從目前的300億美元增加到約1500億美元。

AMD不想錯過這場AI盛宴，但英偉達是橫亙在眼前的不得不翻越的大山。

在最新一季的財報中，AMD的數據中心業務營收12.95億美元，同比上一季度的12.93億美元，基本沒有增長。反觀英偉達，今年第一季度的數據中心業務營收創歷史新高，同比增長14%至42.8億美元，是AMD的三倍多。

而根據量化對沖基金Khaveen Investments測算，英偉達數據中心GPU在2022年的市佔率高達88%，AMD和英特爾瓜分剩下的部分。

雖然AMD是GPU市場的老玩家，但其過去的GPU系列產品主要應用於圖像處理及AI推理領域，而對於並行計算要求更高的AI訓練卻入場較晚。

而Instinct MI300的發布，意味著AMD試圖在AI訓練市場，改變英偉達一家獨大的局面。

02 進軍AI訓練

Instinct MI300是第一款面向數據中心的高性能“APU”——一個由AMD獨創的概念。

2011年（AMD收購ATI的第五年），AMD在產品構想中以CPU和GPU分別類比人類左右腦，並基於此提出了“CPU+GPU”的異構產品策略，並將其命名為APU。

類比人腦，AMD認為左腦更像CPU，負責對信息的邏輯處理，如串行運算、數字和算術、分析思維、理解、分類、整理等，而右腦更像GPU，負責並行計算、多模態、創造性思維和想像等。

圖片來自華泰研究

不過，2011年的AMD正處在“失去的十年”低谷期，無論是在CPU線還是GPU線，都沒能拿出足夠優秀的產品，APU的發展不盡如人意。

時間來到2020年3月，AMD發布了新的微架構版本CDNA，專門針對數據中心的高性能計算、AI計算而設計。在此之前，AMD的GPU是用同一套架構同時解決遊戲與計算場景需求，自然不利於不同場景的優化。

Instinct系列產品，就是專為HPC高性能計算、AI計算而生的。而最新發布的MI300，在規格及性能方面都全面追擊英偉達的Grace Hopper。

Instinct MI300採用了台積電5nm工藝，有兩個不同的版本：MI300X僅有GPU，專為AI模型訓練設計，封裝了1530億顆晶體管；MI300A則是集多個CPU、GPU和高寬帶內存於一身的APU，封裝了1460億顆晶體管。

AMD聲稱Instinct MI300比上一代產品MI250的AI性能高8倍，它可以將ChatGPT和DALL-E等超大型AI模型的訓練時間從幾個月減少到幾週，從而節省數百萬美元的電費。

AMD在發布會現場演示了MI300x運行400億參數的Falcon模型，讓它寫了一首關於舊金山的詩。蘇姿豐表示：“模型對容量的要求越來越大，你實際上需要多個GPU來運行最新的大型語言模型。”她指出，隨著AMD芯片上內存的增加，開發人員將不需要那麼多GPU。

AMD尚未公佈MI300定價，但管理層在FY23Q1財報電話會中表示數據中心產品將延續往日的高性價比定價風格，重點先把市場打開。

AMD預計MI300將於今年底前推出，並將搭載於勞倫斯利弗莫爾國家實驗室的百億級超級計算機EI Capitan及其他大型雲端客戶AI模型中。

大摩分析師Joseph Moore給出樂觀指引稱，AMD已看到來自客戶的“穩定訂單”，公司2024年的AI相關營收有望達到4億美元，最高甚至可能達到12億美元——這一預期是此前的12倍之多。

不過，儘管AMD幾乎是唯一一個有能力對英偉達帶來挑戰的公司，但這必然是一個非常艱難的過程。

03 英偉達的護城河

在AMD的產品發布會之後，資本市場對此反響平平，AMD的股價下跌了3%以上，反而是英偉達的股價又上漲了3.9%，市值再次超過一萬億美元。

在投資人眼裡，AMD的年度芯片MI300似乎仍然難以撼動英偉達的根基。

比如，AMD沒有在發布會上透露它的年度芯片獲得了哪些大客戶的支持。TIRIAS Research首席分析師凱文·克雷韋爾（Kevin Krewell）表示：“我認為，沒有（大客戶）表示將使用MI300X或MI300A，這可能會讓華爾街感到失望。他們希望AMD宣布已經在某些設計方面取代了英偉達。”

目前透露的客戶僅有開源大模型獨角獸Hugging Face，以及更早之前透露的勞倫斯利弗莫爾國家實驗室。但兩者與對數據中心芯片有更大需求的雲巨頭而言不在一個數量級。

從芯片本身的性能而言，雖然MI300在一些參數上超過了英偉達，比如晶體管數量要高於A100的540億個，但是英偉達可能很快就會通過產品的迭代來彌補。

實際上英偉達已經在這麼做了。5月29日，在AMD發布會之前兩週，英偉達在COMPUTEX 2023展前發布會上，正式發布了全新的GH200 Grace Hopper超級芯片，擁有2000億個晶體管，比MI300還要高。

更重要的是，英偉達同時宣布了Google、微軟和Meta將是首批採用這一超級芯片的大客戶。

除了產品本身過硬之外，英偉達另一個銅牆鐵壁一般的護城河，就是它的CUDA生態。

英偉達於2007年發布CUDA生態系統。通過使用CUDA，開發者可以將英偉達的GPU用於通用的計算處理，而非僅限於圖形處理。

CUDA提供了一個直觀的編程接口，它允許開發者使用C，C++，Python，以及其他一些語言來編寫並行代碼。

AI大神吳恩達曾對此評價：“CUDA出現之前，全球能用GPU編程的可能不超過100人，有了CUDA之後使用GPU就變成了一件非常輕鬆的事情。”

AMD在2016年推出了ROCm，目標是去建立可替代CUDA的生態。2023年，CUDA的開發者已達400萬，包括Adobe等大型企業客戶。用戶越多，粘性越好，起步就晚的ROCm要想構建開發者生態還需要時間。

Moor Insights & Strategy分析師Anshel Sag表示：“儘管AMD在硬件性能方面具有競爭力，但人們仍然不相信AMD的軟件解決方案能與英偉達競爭。”

這是屬於英偉達的獨一無二的護城河。AMD要想打破，極具挑戰。

04 AMD的成功，可能難以復制

對於AMD來說，或許最不怕的就是面對挑戰。

從2006年到2016年，這是AMD“失去的十年”。這一時期，AMD的兩個最大的競爭對手英特爾和英偉達，正在摩爾定律的驅使下進行產品迭代。

英特爾踐行著“Tick-Tock鐘擺策略”，每兩年做一次大的產品迭代更新（一年工藝製程、一年微架構設計）；英偉達則在黃仁勳提出的“黃氏定律”——顯卡每6個月性能提升一倍——的指引下，每半年將產品升級一次。

AMD沒能跟上兩個行業老大的產品更新節奏，公司發展一度瀕臨崩潰，直到2014年蘇姿豐作為AMD第五任CEO接手。

蘇姿豐剛接手的AMD是一個爛攤子，它的筆記本電腦市場被英特爾佔據，新興的智能手機市場被英偉達、高通和三星瓜分，服務器市場份額也從原來的1/4縮水至僅2%。AMD不得不解雇了大約四分之一的員工，股價徘徊在2美元左右，分析師直稱“已無法投資”。

當時英特爾CEO柯再奇如此評價AMD：“這家公司永遠不會再回來了，所以不要再介意把重點放在新的競爭對手高通身上了。”

但後來的故事大家都知道了。在蘇姿豐的帶領下，AMD在CPU市場打了一場漂亮的翻身仗，不僅一步步蠶食了英特爾的市場份額，股價也在2022年2月曆史性地反超了英特爾。

AMD之所以能夠在CPU市場突圍，很重要的原因在於抓住了對手英特爾的戰略失誤。

在芯片製造這一環節，AMD與英特爾選擇了不同的路線。AMD在2009年剝離了旗下的芯片製造業務，合資成立了獨立的晶圓代工廠格芯，而自身只專注於芯片設計（Fabless），這讓AMD可以選擇獨立的第三方晶圓代工廠（Foundry）。英特爾則從成立以來一直是集芯片設計與芯片製造於一身（IDM）。

在半導體產業發展的早期，像英特爾這樣高度垂直整合的IDM才是更主流的模式。AMD聯合創始人Jerry Sanders還說過一句名言：“有晶圓廠才是真男人（Real men have fabs）。”不過諷刺的是，AMD正是因為後來剝離了晶圓廠才有機會完成逆襲。

2014年之後，英特爾的芯片製程遭遇技術困難，10nm芯片（相當於台積電7nm）良率不佳，導致原定於2016年下半年的10nm量產多次推遲，最終到2019年下半年才發布。此前英特爾一直堅持的Tick-Tock策略也因製程技術原因而放棄。

英特爾創始人戈登摩爾提出了摩爾定律，但英特爾現在卻遭遇了“摩爾定律的詛咒”。這讓AMD抓住了反超的機會。

2018年，AMD先是與格芯合作，推出12nm製程的Zen+架構，首度在製程上超越了14nm的英特爾。隨後在2019年，AMD與台積電合作，推出了7nm製程（相當於英特爾10nm）的Zen 2架構，領先英特爾。自此之後，英特爾一直在製程上落後AMD一拍，直到現在仍然沒有改善。

類似的“老二挑戰老大”的劇本似乎在重新上演，只是戰場從CPU換成了GPU。雖然AMD還是“蘇媽”帶領的AMD，但黃仁勳帶領的英偉達，卻比當年的英特爾風頭更盛。

在矽谷，黃仁勳被稱為好鬥的男人，愛穿黑色皮衣，時刻做好反擊的準備，股價漲到100美元時還把英偉達logo文到胳膊上。

2016年黃仁勳還不把AMD放在眼裡，他直接評價說英偉達跟AMD是“9跟0”的差距。2019年初AMD搶在英偉達之前首發7nm顯卡，黃仁勳表面上似乎也毫不在意，直稱“這顯卡很一般”。

而AMD再一次用更好的產品向英偉達發起挑戰。一邊是躊躇滿志的AMD，一邊是獨孤求敗的英偉達，一場關於人工智能的GPU大戰，現在才剛剛開始。

WONGCW 網誌

記錄生活經驗與點滴

AMD發起AI芯片挑戰但英偉達依然獨孤求敗

2023-06-15 Comments 0 Comment

相關

發表迴響取消回覆

2023 年 6 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

分享此文：

相關

發表迴響取消回覆