世界最強NPU:AMD銳龍AI 300系列發表AI PC煥然一新
AMD 2023年初發布的銳龍7040系列(代號Pheonix),是全球首款集成獨立NPU AI引擎的x86處理器,基於全新設計的XDNA架構,算力約10TOPS(每秒10萬億次浮點運算) ,加上CPU、GPU整體算力約33TOPS,開創了AI PC的新時代。
2023年底的銳龍8040系列(代號Hawk Point),NPU AI算力一舉提升了60%,達到約16TOPS,整體算力也提升至39TOPS。
現在,Strix Point終於登場了,官方命名為“銳龍AI 300系列”,架構煥然一新,性能也再次飛躍,成為下一代AI PC的基石。
CPU是全新的Zen5架構,GPU是升級版的RDNA3.5架構,NPU是全新的XDNA2架構,號稱「針對下代AI PC/Copilot+ PC的世界級處理器」。只有製造過程停留4奈米,畢竟非常成熟了。
銳龍AI 300系列首發只有兩款型號,都定位高端市場。
其中,「銳龍AI 9 HX 370」是頂級旗艦,CPU部分擁有12核心24線程,多年來首次在這一定位上提供更多核心,相比銳龍8040系列增加了多達1/3。
二級快取還是每核心1MB,總容量自然增加到12MB。
三級快取終於打破了16MB的“禁錮”,增加了足足一半來到24MB。
基準頻率2.0GHz,最高主頻5.1GHz,跟現在倒是差不多。
GPU部分不但升級架構,CU單元數量也從12個增至16個,命名為「Radeon 890M」。
NPU部分算力來到了50TOPS,增加了2倍有餘,問鼎最強NPU的寶座。
「銳龍AI 9 365」也是高階型號,10核心20線程,二級快取10MB,三級快取仍為24MB,最高頻率達5.0GHz。
NPU算力還是50TOPS,GPU部分精簡12個CU單元,改名為Radeon 880M。
TDP熱設計功耗都是18W,可調範圍18~54W。
說了這麼多,大家也看到了,AMD這一代行動處理器採用了全新的命名方式,不再是單純的四位數字,而是將AI直接加入品牌名,地位之高前所未有。
9 HX、9都是代表產品級別,但注意這裡的HX,和以往高端遊戲本處理器用的HX(比如銳龍9 7945HX)不是一回事。
數位編號採用300系列,代表從NPU單元的角度來看,這已經是第三代AI PC處理器。
以上是一二代XDNA NPU架構的比較圖,可以看到整體佈局基本上一致,但規模大大擴充。
AI Tile(初代叫AIE Tile)也就是核心的AI計算引擎模組,從之前的20個增加到32個,再加上本身的增強。
Mem Tile也就是本地記憶體模組,從原來的5個增加到8個,可以更好地配合更大規模的本地調度、運算。
另外,用於互連的交叉匯流排也從普通的Data Fabric,升級為Zen/RDNA家族上無所不在的I nfinity Fabric,傳輸頻寬和效率更高。
AMD聲稱,XDNA2 NPU的運算能力提升了多達5倍,多任務並行能力翻了一番,能源效率也提升了最多2倍。
這裡說的提升5倍,來自Llama 2 70億參數大模型的反應速度,從啟動到獲得第一個token,銳龍AI 9 HX 370達到了銳龍9 8940HS的多達5倍。
另外非常關鍵的一點,XDNA2首發引入了全新的Block FP16浮點精度,也就是BFloat16、BF16。它在CPU、GPU上已經很常見,而在NPU上還是第一次。
傳統的FP8浮點格式性能高且精度不足,FP16浮點格式精度高而性能略遜,而將二者融合起來的BF16可以在精度、性能上達到較好的平衡,靈活性也更高。
同時,大多數AI應用都採用了16位元精度,因此有了BF16,不再需要量化為8位元精度,減少了轉換步驟,提高了執行效率。
高通驍龍X Elite NPU的算力為45TOPS,Intel即將推出的下一代酷睿Ultra Lunar Lake NPU算力同樣是45TOPS,銳龍AI 300系列則一舉超越二者,成為當今最強NPU。
至於蘋果,M4 NPU的算力只有區區38TOPS,還不到Windows陣營這邊Copilot+ PC的最低算力需求門檻40TOPS。
隨著算力的大幅提升,NPU的應用也將不再局限於一些持續性低負載場景(例如視訊會議),而是有了更多可能,一方面可以在更多場景中部分取代CPU、GPU ,以更高的能源效率執行AI運算,大大提升筆記本的續航力。
另一方面,更強力的NPU配合更強的CPU、GPU,可以在更多場景中部署端側AI,進一步擺脫對雲端的依賴,最大好處就是可以避免隱私外洩和安全威脅。
當然,硬體算力再強,也需要生態應用的落地配合。
身為AI PC的先驅,AMD 2024年內的ISV合作廠商將超過150家,既有Adobe、微軟、Topaz Labs這樣的世界級大廠,也有百川智能、釘釘、、無問芯穹、有道這樣的國內名企,前途不可限量。
當然,新一代AI PC的最大亮點就是配合Windows,可以打造全新的Copilot+體驗,例如歷史回憶、視訊會議即時錄製與翻譯、協同創作等。
最後是一些官方性能對比,供參考。
銳龍AI 9 HX 370對比驍龍X Elite,日常辦公室、生產力創作、多任務、圖形等各方面都遙遙領先,尤其是圖形計算,驍龍在移動端無敵,但是在AMD面前還是個弟弟。
對比Intel目前最好的酷睿Ultra 9 185H,無論是日常應用還是遊戲,都已經不在一個級別上,就看下一代Lunar Lake的表現了。
蘋果這邊就更不夠看了,尤其是多工、3D圖形效能,不在一個層次。
銳龍AI 300系列的筆電將從7月起陸續上市,目前已有100多款設計,涵蓋宏碁、華碩、戴爾、惠普、聯想、微星等各大主要OEM品牌。
華碩會在台北電腦展上宣布一系列配備銳龍AI 300系列處理器的筆記本,其中輕薄本有16吋的靈耀(Zenbook S)、14/15/16吋的無畏(Vivobook S),創作本有16和13吋的ProArt P16/X13,遊戲本有16吋的ROG幻系列、14/16吋的天選系列(TUF GAMING A14/A16)。
微星首批三款,都是16吋大螢幕機型,包括高階商務辦公的Summit A16 AI+,輕薄全能遊戲型的絕影A16 AI+、主打超薄商務與創作的尊爵A16 AI+。
晶片圖賞: