AMD官宣年更晶片:新款MI325X重磅發布比H200快1.3倍
AMD在Computex主題演講上大出風頭,推出了首批Zen 5處理器,包括桌上型電腦用Ryzen 9000 CPU和筆記型電腦用Ryzen AI 300「Strix Point 」APU。除此之外,AMD也宣布了晶片年更計畫以及備受期待的第五代EPYC Turin處理器。昨天,老黃在Computex上的演講再一次讓英偉達成為全世界的焦點,而同在晶片產業的AMD也不甘落後,推出了更強大的產品組合,全面進軍AI PC 領域。
晶片年更,與領頭羊英偉達一較高下
自去年以來,英偉達向投資者明確表示,計劃將發布週期縮短為每年一次,現在AMD也緊隨其後,開始晶片年更。
執行長蘇姿豐(Lisa Su)表示「每年都有這樣的節奏,是因為市場需要更新的產品和能力…… 我們每年都會有下一個大事件,這樣我們就始終擁有最具競爭力的產品組合。
她詳細介紹了該公司未來兩年開發人工智慧晶片的計劃,以挑戰行業領導者英偉達。
最新的MI325X加速器將於2024年第四季上市。
即將推出的名為MI350的晶片系列,預計於2025年上市,並將基於新的晶片架構。與現有的MI300系列人工智慧晶片相比,MI350在推理方面的效能預計將提高35倍。
2026年,MI400系列將會推出,該系列將基於名為「Next」的架構。
如此這般,AMD和英偉達“你方唱罷我登場”,兩者之間的較量充滿了刀光劍影。
開發生成式人工智慧程式的競賽催生了人工智慧資料中心的發展,而支撐資料中心的就是這些先進晶片。
AMD一直是英偉達的競爭者,後者目前主導著利潤豐厚的人工智慧半導體市場,佔據了約80%的份額。
現在,為了追趕英偉達,AMD更加孤注一擲,“人工智慧顯然是我們公司的頭等大事,我們確實利用了公司內部所有的開發能力來實現這一點。”
先不管晶片表現如何,AMD此舉也是為了吸引投資人的注意。
在華爾街「鏟子」交易中投入了數十億美元的投資者一直在尋求晶片公司的長期更新,因為他們要評估生成式AI蓬勃發展的持久性,而這一趨勢迄今為止還沒有放緩的跡象。
自2023年初以來,AMD股價已上漲一倍以上。與同期英偉達股價七倍多的漲幅相比,這一漲幅仍然相形見絀。
蘇姿豐在4月表示,AMD預計2024年AI晶片銷售額約40億美元,比先前的估計增加了5億美元。
在Computex活動上,AMD也表示其最新一代中央處理器單元(CPU)可能會在2024年下半年上市。
雖然企業一般會優先考慮在資料中心使用人工智慧晶片,但AMD的部分CPU也會與GPU結合使用,不過兩者的比例更傾向GPU。
AMD詳細介紹了其新型神經處理單元(NPU)的架構,專門用於處理AI PC中的設備端AI任務。
隨著個人電腦市場走出長達數年的低谷,晶片製造商們一直寄望於人工智慧功能的增強來推動個人電腦市場的成長。
惠普和聯想等個人電腦供應商將發布包含AMD AI PC晶片的設備。 AMD還放出話來,他們的處理器已經超過了微軟對Copilot+PC的硬體要求。
3nm EPYC Turin,AI負載超越英特爾
蘇姿豐在Computex 2024的主題演講中宣布,備受期待的第五代EPYC Turin處理器,具有192個核心和384個線程,在人工智慧工作中比英特爾Xeon快5.4倍,將於2024年下半年推出。
這個3nm晶片標誌著AMD Zen 5架構首次應用於資料中心晶片,AMD聲稱它們在關鍵AI工作負載上的效能比英特爾目前世代的Xeon晶片快5.4倍。
Turin據說有兩個版本:一個使用標準的Zen 5核心,另一個使用稱為Zen 5c的密度最佳化核心。蘇姿豐也宣布,AMD現在已經佔據了資料中心市場的33%。
新的Zen 5c晶片將配備多達192個核心和384個線程,採用3nm製程節點製造,然後與塞入單一插槽的6nm I/O Die(IOD)配對。
整顆晶片由17個小單元組成。最高核心數型號採用AMD的Zen 5c架構,該架構使用密度優化的核心,概念上類似於英特爾的e-cores。不過,AMD率先在資料中心的x86晶片中使用這種核心類型。
配備標準全性能Zen 5核心的機型配備12 個採用N4P製程節點的運算晶片和一個中央6奈米IOD晶片,總共13個小晶片。
AMD聲稱,在LLM(聊天機器人)中,AMD的優勢是Xeon的5.4倍,在翻譯模型中是Xeon的2.5倍,在摘要工作中是Xeon的3.9倍。
AMD也展示了其128核Turin模型在科學NAMD工作負載中的3.1倍優勢,並現場演示了Turin每秒生成的token數量比Xeon多4倍。
192核心Zen 5c晶片是AMD EPYC Bergamo的後續系列,後者是業界首款具有密度最佳化核心的x86資料中心處理器(Zen 4c)。 Bergamo的最高核心為128個。
採用Zen 5架構的標準Turin型號可擴展到128個核心,每個核心面積減半但功能不變,與當前一代EPYC Genoa(最高96個核心)相比,實現了強勁的世代提升。
Zen 5c Turin晶片將與英特爾的144核心Sierra Forest晶片和Ampre的192核心AmpereOne處理器展開競爭,前者標誌著英特爾在其Xeon資料中心陣容中首次採用效率核心(E-cores),後者則標誌著Google和微軟正在開發或採用客製化晶片。
同時,標準的Zen 5 EPYC處理器將迎戰英特爾即將推出的Xeon 6系列。
AMD還分享了一些基準測試,以突出它相對於英特爾競爭型號的優勢。隨著Turin 晶片越來越接近市場,我們可以期待更多的細節。
Ryzen AI 300系列「Strix Point」處理器
AMD揭開Ryzen AI 300系列「Strix Point」處理器的神秘面紗-50 TOPS的AI效能,Zen 5c密度核心首次應用於Ryzen 9。
Strix Point APU配備了XDNA 2 AI加速器,AMD表示該加速器能夠實現高達50 TOPS的效能,領先最近微軟使用的高通驍龍X Elite(45 TOPS)。
作為一款具有強大整合顯示卡的APU,遊戲也是測試的一部分。
AMD希望透過其整合Radeon 880M和890M GPU來確保遊戲領域的領先地位。
根據AMD的展示,Ryzen AI 300系列晶片平均性能比英特爾Core Ultra 185H快36%。
這裡的平均分數取自六款主要遊戲的基準測試,包括《Cyberpunk2077》、《無主之地3》、《F1 23》、《刺客教條幻影》、《古墓奇兵:暗影》和《孤島驚魂6》。
代號為Strix Point的全新Ryzen AI 300系列晶片,採用全新的Zen 5 CPU微架構,擁有兩種核心、升級的RDNA 3.5圖形引擎,當然還有AMD全新的XDNA 2引擎,可在本地運行AI工作負載。
AMD的新品牌方案現在將AI直接帶入了晶片名稱中,這反映了該公司對以AI為重點的全新XDNA 2神經處理單元(NPU)的強烈關注。
XDNA 2現在可提供50 TOPS的效能,是AMD第三代AI處理器效能的5倍。
這個效能等級超越了Windows PC的所有其他晶片,包括高通公司前景看好的驍龍X Elite,並輕鬆超過了微軟對下一代AI PC的40TOPS要求,這是在本地運行Copilot的最低硬體要求。
AMD在其他方面也取得了許多進步,針對輕薄型和超輕型筆記型電腦的Zen 5處理器已升級到12核,過去只能使用8個CPU核心,而新的RDNA 3.5集成圖形引擎最多可使用16個計算單元,比上一代的最多12個增加。
旗艦級Ryzen AI 9 HX 370配備了12個核心和24個線程,基本頻率為2.0 GHz,峰值頻率為5.1GHz。
不過,從品牌宣傳幻燈片可以看到,該晶片與GPU和NPU核心一起,在單晶片上配備了4個標準Zen 5核心和8個密度優化的Zen 5C核心。
這標誌著更小的Zen 4c核心首次出現在最高級別的Ryzen 9移動系列中,因為這些核心以前僅限於AMD採用上一代鷹點晶片的最低端Ryzen 5和3型號。
與標準的Zen 5性能核心相比,AMD的Zen 5c核心旨在減少處理器晶片上的空間佔用,同時為要求不高的任務提供足夠的性能,從而節省電能,並在每平方毫米上提供比以前更多的計算能力。
雖然這種技術在概念上與英特爾的E-cores類似,但AMD的Zen 5c採用了與標準Zen 5核心相同的微架構,並透過較小的核心支援相同的功能,而英特爾的設計則採用了不同的架構和功能支援。
不過,較小的Zen 5c核心工作時脈頻率較低,因此峰值性能不如標準核心,但它們也為其他附加功能(如更大的GPU和NPU)保留了晶片面積。
HX 370晶片還擁有36 MB三級快取、50 TOPS XDNA 2 NPU和新的RDNA 3.5 Radeon 890M圖形引擎。
該晶片的額定TDP為28W,但其寬泛的cTDP範圍意味著這並不能反映其實際運作功耗水準。
Ryzen AI 9 365配備10個核心,包括4個標準Zen 5核心和6個經過密度優化的Zen 5c核心,基本頻率為2.0GHz,峰值頻率為5.0 GHz。
該晶片還配備了50 TOPS NPU和一個12-CU RDNA 3.5 Radeon 880M圖形引擎,運行頻率為2.9 GHz。
雖然CPU和GPU核心數較低,但這款晶片的TDP也和它的「老大哥」一樣,達到了28W,儘管這個評級現在的重要性值得懷疑。
AMD的上一代7040和8040系列共有九個型號,因此這兩款新的Ryzen AI 300顯然只是AMD新的人工智慧產品系列的第一炮。
AMD Ryzen 9 AI 300系列基準測試表現如何?
AMD聲稱LLLM車型比當今市場上的行動處理器具有5倍的性能優勢,但值得注意的是,尚未發布的45TOPS高通驍龍X Elite和48 TOPS Lunar Lake並未包含在這些基準測試中。
不過,AMD與高通公開發布的生產力工作基準數據進行了比較,聲稱Ryzen AI 9 HX 370在響應速度方面有5%的優勢,在生產力工作負載方面有10%的優勢。
該公司還提供了高達60%的性能優勢圖形性能突顯其遊戲實力。蘋果的M3也被拉來比較,AMD聲稱在生產力方面有9%的優勢,在影片編輯方面有11%的優勢,在3D渲染方面有98%的優勢。
英特爾的Core Ultra 185H也出現在AMD的基準測試名單中,AMD聲稱它在工作負載方面領先4%,在影片編輯方面領先40%,在3D渲染方面領先73%。在一系列遊戲中,iGPU效能比Core Ultra 185H高出36%。
接下來,壓力就給了英特爾即將在第三季推出的Lunar Lake處理器。
AMD決定在其頂級Ryzen 9系列中採用密度優化的Zen 5c核心,這使其能夠在更小的晶片面積上容納更強的運算能力,從而為大幅擴展iGPU和NPU留出空間,這兩者將在遊戲和人工智慧等其他方面帶來紅利。
憑藉full-fat Zen 5核心的效能優勢,以及更快、更有效率的新製程節點,Ryzen AI 300系列晶片與英特爾、高通和蘋果的晶片相比極具競爭力,為2024年行動市場的激烈競爭奠定了基礎。
現在剩下的就是在第三方基準測試中看看這些晶片的表現了,這些晶片預計將於2024年7月面世,我們拭目以待。