AI誕生67年後為什麼看好AMD?EPYC CPU近乎無所不能
前幾年講故事,不帶上XR混合現實、區塊鏈、元宇宙什麼的,你都不好意思和人打招呼。如今,AI也是同樣的待遇。不過,不像前邊幾個更多是停留在概念性,缺乏群眾基礎,有的甚至隱約有些“詐騙”的味道,AI其實有著悠久的歷史,有著很現實、很廣泛的技術和應用,更有著真正廣闊的未來,就像曾經的科幻正在一步一步走入現實。
2023年3月的Adobe峰會期間,AMD首席執行官蘇姿豐博士在和Adobe首席執行官Shantanu Narayen進行對話時,她提出,未來10年,最重要的事情就是AI,它甚至可以主導芯片設計。
其實早在1956年,人工智能(Artificial Intelligence)的概念就誕生了,算下來已有長達67年的歷史。
不過直到1997年,IBM公司的“深藍”電腦擊敗國際象棋大師卡斯帕羅夫,才讓AI的概念廣為人知,被視為世界三大尖端技術之一(另兩個是空間技術、能源技術) ,也被認為是21世紀三大尖端技術之一(另兩個是基因工程、納米科學)。
2016-2017年,Google AlphaGo與李世石、柯潔等高手的圍棋大戰,將AI推向了一個新的高度。
2022年11月,OpenAI ChatGPT的誕生,更是讓AI走向了全民化。
自誕生以來,AI的追求始終都是用機器模擬甚至超越人類智能,無論用什麼方法、什麼技術,這一終極目標從未改變。
幸運的是,經過半個多世紀的演進,半導體技術已經達到了空前的高度,無論算力性能還是算法應用,都給了AI無限的可能。
實現這些可能的根基,毫無疑問是強大的硬件,否則一切都是建築在沙丘之上。
能夠運算AI的硬件多種多樣,可以分為兩大類。
一是傳統的是CPU處理器,好處是通用性強,什麼都能做,尤其擅長邏輯控制與串行計算,缺點就是計算能力和針對性不夠強。
二就是加速卡,又分為三類,其中GPU適合大量重複計算;FPGA靈活性好,集成度高,但是算力一般,成本高;ASIC專用性強,但開發週期長,難度極高。
今年6月份的“數據中心與人工智能技術首映會”上,AMD給出的數據顯示,僅僅是在數據中心, AI加速器的市場價值在2023年就有約300億美元,預計到2027年可超過1500億美元,年復合增長率超過50%,妥妥的藍海。
目前,Intel、AMD、NVIDIA三巨頭都有各自豐富的AI軟硬件解決方案,CPU、GPU可以做,但又各自不同。
Intel CPU歷史悠久,一直有領導地位,但近些年遭遇重大挑戰,GPU則剛剛起步。
NVIDIA GPU執行業牛耳,優勢很大,但是CPU受到極大限制,只能走ARM架構。
AMD則一直是綜合性最強的,以往被戲稱“GPU吊打Intel、CPU吊打NVIDIA”,如今更是在CPU方面各種欺負Intel,GPU也在奮起直追、不斷創新,此外,現在AMD還擁有豐富的FPGA和自適應SoC產品系列供選擇。
更進一步,不僅僅在數據中心,AMD在消費端的AI也嶄露頭角,銳龍7040系列就是全球首款集成獨立AI引擎的處理器,開啟了AI筆記本的時代。
AMD GPU AI加速器就是Instinct系列,經過多年迭代已經發展得極為成熟,在技術上某些方面更是遙遙領先。
比如最新的Instinct MI300A是全球第一款面向HPC、AI的APU加速器,同時集成CDNA 3架構的GPU、Zen 4架構的CPU、128GB HBM3高帶寬內存。MI300X更是整合了史無前例的192GB HBM3內存,晶體管數量多達1530億個,令人嘆為觀止。同時,AMD ROCm開發平台也正進行改革,針對AI進行全方位深度優化。
GPU做AI如此強悍,已經是很多企業、開發者的首選,你也應該聽說過“GPU徹底取代CPU地位”之類的言論,但其實這都是宣傳套路而已,聽听就行了,切莫認真。
不然的話,NVIDIA為啥還要做個Grace CPU來搭檔自家GPU,還號稱“超級芯片”?
CPU、GPU、FPGA、ASIC無論哪一個,在AI面前都無所謂誰好誰壞,關鍵是在靈活多變的AI需求面前,各自做最適合自己的工作。
打個比方,GPU、FPGA、ASIC就像是具備不同特殊技能的特種兵,在某項工作上可以做得非常好,CPU則像是核心領導,只有在它的協調指揮下,才能形成強大的整體戰鬥力,否則只是一盤散沙而已。
因此,如果非要給大家排個序,CPU反而更有資格排在前列。
這也正是AMD的核心優勢,一方面有著極為完整、久經考驗的完整產品線和綜合平台,另一方面其EPYC CPU處理器近些年更是意氣風發,甚至大有完全不把Intel至強放在眼裡的架勢。
EPYC堪稱AMD歷史上最成功的產品之一,每一代都極為閃耀,甚至可以說是一直遙遙領先。
2017年,隨著基於初代Zen架構、代號Naples的第一代EPYC 7001系列的誕生,AMD終於重返高性能計算市場,得到了整個行業的熱烈歡迎。
第三代Milan EPYC首次延伸除了專門針對高密度計算需求的Milan-X,通過堆疊3D V-Cache緩存,得到了數倍的性能提升,在業內是獨一無二的存在。
最新的第四代Genoa EPYC 9004系列,更是多點開花,從通用計算到高密度計算,從雲服務到邊緣計算,再到AI,幾乎無所不能。
其中,標準版的Genoa升級到先進的5nm工藝、Zen 4架構,憑藉成熟的Chiplet佈局,做到最多96核心192線程,還有12通道DDR5內存、160條PCIe 5.0總線的強力加持。
同時,為了滿足更多應用領域的特定需求,這一代的EPYC極大地豐富了產品線,除了標準版之外還衍生出了三個特殊系列:
一是Genoa-X EPYC 9084X系列,加入了極為成功的3D V-Cache,是世界上首個採用3D芯片堆疊緩存的數據中心處理器,最多達768MB,加上原生的256MB,三級緩存就有1152MB,再算上6MB一級緩存、96MB二級緩存,總計就是海量的1254MB。
對於需要極強計算性能的應用,Genoa-X是絕對的大殺器,可以輕鬆獲得數倍的性能提升,對手根本看不見尾燈。
二是Bergamo EPYC 9704系列,首次採用精簡版的Zen 4c架構,單個核心面積相比標準的Zen 4縮小了大約35%,同時能效大大提升,可以做到遙遙領先的128核心256線程,而且同樣有12通道DDR5、160條PCIe 5.0,是雲原生計算領域的上佳之選。
三是即將發布的Siena系列,也是Zen 4c架構,據此前信息了解其是專為邊緣計算等應用打造,能效同樣非常高。
彪悍的規格帶來了彪悍的性能,這一次,AMD EPYC在各種應用場景中都有著顯著的領先優勢。
根據官方數據,96核心的旗艦Genoa EPYC 9654對比60核心的競品旗艦至強鉑金8490H,無論是SPECrate2017_int為代表的雲服務應用中,還是Java、VMmark、SAP等企業級應用中,性能差異都達到了1.8倍左右,可以說直接甩開了一個身位,根本不給追趕的空間。
更關鍵的是,性能非常高的同時,EPYC的能效也非常高,性能優勢也達到1.8倍左右。
128核心的Bergamo EPYC 9754在雲原生應用中,更是近乎蹂躪至強鉑金8490H,性能優勢更是最高達到驚人的2.6倍。
96核心、1152MB三級緩存的Genoa-X EPYC 9684X,在計算性能上的表現也是逆天級別,對比競品的優勢幾乎達到了3倍。
目前,戴爾、慧與、聯想、超微都已推出基於Genoa-X的高性能計算系統。
當然了,作為AMD AI產品矩陣的一環,EPYC在AI方面的表現同樣不遑多讓,極強的計算能力帶來了極佳的表現。
隨便舉個例子,TPCx-AI端到端負載計算中,EPYC 9654相比於至強鉑金8490H的性能優勢輕鬆達到了大約1.9倍之多。
AMD EPYC處理器、Instinct加速器可謂珠聯璧合,已經在數據中心、超級計算機中得到了廣泛應用。
最典型的就是當今世界第一超算“Frontier”,也是唯一投入實用的百億億次超算,用的就是這對黃金組合,其中處理器是Zen 3架構的64核心旗艦EPYC 7A53,加速器則是CDNA 2架構的Instinct MI250X,而且它的綠色能效也是位居前列。
當然了,EPYC、Instinct強強聯手的同時,它們也是開放的,完全可以搭檔友商的硬件使用,AMD ROCm開發框架同樣提供良好的支持。
比如NVIDIA DGX高性能計算平台,就一直在使用頂級的EPYC處理器,可加速多種類型的AI工作負載,例如數據分析、訓練和推理等。
任何一個美好的故事,要想持續講下去,要想變得越來越美好,都必須要有紮實的根基,從硬件到軟件再到應用都必須到位才能真正普及開來,MR就是最典型的反面例子。
走過半個多世紀的AI正在煥發新的活力,恰恰就是因為從硬到軟,技術和應用都在持續演進,形成了正向循環。
ChatGPT為代表則這一波的爆發,可以說是AI歷史上一個新的節點。它最大的貢獻就是讓AI不再高高在上,而是真正來到了普通老百姓的身邊,工作、生活、娛樂都能從中獲益匪淺,大大減輕人的壓力,可以盡情享受成果。這也正是技術應該帶給人的美好之處。
這一切的實現,規格到底,離不開硬件技術的進步、軟件生態的成熟、應用領域的豐富。從CPU到GPU,從FPGA到ASIC,都在為AI的繁榮提供紮實的基礎,而擁有最全解決方案的AMD,前景尤為值得期許!