三大架構革新帶來全面硬體升級AMD銳龍9000/銳龍AI 300處理器解析
6月份,AMD在台北電腦展上發布全新的銳龍9000系列桌面級處理器、X870/X870E系列晶片組以及面向AI PC的銳龍AI 300系列移動級處理器平台之後,用戶對於AMD新平台的期待值可謂日益高漲,只等新平台全面上市。
而就在上週(美國西部時間7月9日-10日),AMD舉辦了一場「AMD TECH DAY」技術分享活動,在新平台上市之前,讓我們對其有了更深入的了解。
·AMD銳龍9000系列處理器全面升級
7月31日,AMD銳龍9000系列桌面級處理器將與大眾用戶見面,它能夠提供具有領導性的性能體驗,超凡的能效表現,極致的超頻體驗以及更長的平台壽命,是迄今為止AMD Zen架構處理器的集大成一代。
銳龍9000系列基於Zen 5架構打造,新架構帶來出色的效能體驗以及優異的能源效率表現。同時它支援PCIe5.0以及更高頻率的DDR5內存,而沿用AM5介面則體現了更長的平台壽命。同時AMD表示,AM5平台將延續到2027年後,大幅降低了未來用戶煥新升級的成本。
在7月即將上市的新品序列中,首發主要包含了四種型號:銳龍9 9950X、銳龍9 9900X、銳龍7 9700X以及銳龍5 9600X,其具體參數如下:
AMD銳龍9 9950X是本次新品的最高型號,採用16核心32線程設計,頻率加速最高達到5.7GHz,總緩存(L2+L3)高達80MB,預設TDP為170W。
銳龍9 9900X,12核心24執行緒設計,5.6GHz加速頻率,總快取76MB,預設TDP 120W。
性價比更高的銳龍7和銳龍5家族各有一款新品,分別為銳龍7 9700X以及銳龍5 9600X,前者為8核心16線程設計,後者為6核心12線程設計,加速頻率分別為5.5GHz和5.4GHz,快取容量分別為40MB和38MB,預設TDP均為65W。
全新的銳龍9000系列在性能體驗上非常出色。以銳龍9 9900X為例,參考酷睿i9-14900K的生產力與內容創作效能以及遊戲效能,銳龍9 9900X在生產力與內容創作方面,最少領先2%(UL Procyon Office),最多領先41%(HandBrake編解碼);遊戲方面,銳龍9 9900X最少領先4%(無主之地3),最多領先22%(地平線:零之曙光),並且在《賽博朋克2077》、《F1 2023》等畫質級大作上領先幅度超過13%,能勝任更重度的遊戲負載,並為其提供出色的畫面流暢度。
對位酷睿i7-14700K的銳龍7 9700X,在生產力與內容創作以及遊戲效能方面,同樣有著更出色的表現。在生產力與內容創作效能上,銳龍7 9700X最少領先4%(7-Zip壓縮解壓縮)、最高領先42%(HandBrake編解碼);遊戲方面最少領先4%(無主之地3),最高領先31%(地平線:零之曙光)。
銳龍5 9600X也是如此,在對位酷睿i5-14600K時,生產力與內容創作性能最少領先8%(UL Procyon Office),最高領先達94%(HandBrake編解碼);遊戲性能方面最少領先5%(殺手3),最高領先29%(地平線:零之曙光)。
從官方給出的數據來看,銳龍9000系列桌面級處理器在視頻編解碼性能方面獲得了極為顯著的強化,同時在應對大型3D遊戲時,也能夠帶來更加穩定流暢的畫面幀數表現。
在性能表現優異的同時,全新的Zen 5架構為銳龍9000系列帶來了更加出色的能效表現,這意味著銳龍9000系列可以在較低功耗狀態下,就能夠達到與老款處理器同級或越級的性能表現。以官方給出的銳龍7 9700X為例,在遊戲效能方面,這顆處理器在65W功耗下,平均比105W功耗的第一代3D V-cache處理器銳龍7 5800X3D快12%!
整體來說,銳龍9000系列桌面級處理器透過15%的熱阻改善,使得同等TDP下,獲得了7℃左右溫度降低,因此耗電量更低,溫度和噪音控制也更加出色。
對比銳龍7000系列,銳龍9000降低了銳龍9 9950X以下所有型號的TDP,但性能卻得到全方位的提升,最低為11%,最高達到了22%。
當然,銳龍9000系列不僅在於處理器本身效能與能源效率等方面的升級,整個平台級的效能提升才能為使用者帶來更好體驗。因此在記憶體超頻方面,更新AGESA之後將支援DDR5-8000超高速記憶體;同時支援新的運行中記憶體超頻以及記憶體優化效能設定檔功能;而且所有AM5消費性晶片組上都可啟用記憶體超頻,同時JEDEC支援DDR5-5600。
此外,新平台在Overdrive一鍵超頻精度方面也得到了顯著提升,如果用戶希望優先考慮效能效率,特別是多執行緒工作負載,那麼啟用PBO後在較低的預設TDP下可以獲得額外的效能提升空間。其中銳龍9 9900X為6%,銳龍7 9700X為15%,銳龍5 9600X為6%。
對應銳龍9000系列,AMD推出了全新的800系列晶片組。包含X870E、X870、B850以及B840,其中X870E和X870晶片組整合了USB 4控制器,支援PCIe5.0;B850支援PCIe5.0的NVMe介面以及PCIe4.0的顯卡接口,支援20Gbps速率的USB 3.0的顯卡接口,支援20Gbps速率的USB3.3.2。而B840為PCIe3.0以及10Gbps的USB 3.2。
此外,AM5平台在AI效能方面也有著極大幅度的提升。其定義為內容創作、開發、生產力發燒友的終極AI平台。
AM5平台可以提供極為出色的圖形效能,以應對AI大模型的算力需求,同時它具備更高的儲存頻寬速率,以提供更快速的儲存能力。透過銳龍9 9900X平台與酷睿i9-14900K平台對比可以看出,銳龍9 9900X在AI大模型算力方面高出1倍;PCIe5.0 SSD寫入速度高出58%。
在大語言模型AI加速方面,得益於AVX512以及VNNI的卓越性能加速支持,銳龍9 9900X在Llama大模型速度方面比i9-14900K快17%,Mistral速度快20%,AI性能表現優異。
整體來說,全新的銳龍9000系列桌面級處理器在提供更加出色的性能的同時,帶來了更加優異的能效表現,同時在AI加速、內容創作與生產力綜合表現以及遊戲體驗等方面,相比銳龍7000系列以及競品而言都有了顯著提升。同時,在更出色的記憶體超頻加持下,銳龍9000系列將為用戶提供平台級的效能躍升。
·富有彈性的AMD Zen5架構
到這裡,我們要來看看AMD Zen 5架構到底有什麼樣的優勢?
首先,AMD Zen 5架構在基礎核心架構方面做了四大升級:
其一,每個週期交付更多指令;
其二,調度和執行寬度擴大;
其三,快取資料頻寬加倍;
其四,強化AI加速能力。
在分支預測方面,Zen5架構具有高階分支預測的管線取指特性,它實現了更低的延遲,更高的精度以及更大的吞吐量。改善了指令快取延遲以及頻寬,並且支援雙解碼管線。
在調度和執行方面,Zen5架構拓寬了dispatch/retire(調度和引退)的寬度,整合了更統一的ALU調度器以及更大的執行窗口,從而改善了調度和執行效率。
Zen 5架構也增加了資料頻寬,支援48KB 12路L1資料快取4週期加載,L1快取和浮點單元頻寬加倍,同時改進了資料預取。
此外為了提升整個處理器的AI效能,Zen 5架構的AVX-512指令集具有完整的512位元資料路徑,同時提供了6個雙週期延遲FADD管線,並且支援更多數量的FP指令。
在這些特性加持之下,Zen 5架構相對於Zen 4架構來說,IPC平均提升幅度達到了16%。同時其機器學習效能提升32%(單核心),AES-XTS加密演算法效能提升35%(單核心)。
此外,Zen 5架構有著非常不錯的擴充性。更快、更小、更低功率的電晶體使得效能、能效得到最佳化;同時,AMD與TSMC 4nm、3nm製程技術進一步深度合作,從而覆蓋到桌面、伺服器、客戶端以及嵌入式等各類硬體平台。
因此,Zen 5架構不僅包含銳龍9000桌上型處理器,更是有第五代EPYC處理器以及第三代AMD銳龍AI,也就是Strix Point行動裝置級處理器。
·銳龍AI 300系列不妥協的AI PC解決方案
Strix Point,也就是全新的銳龍AI 300系列移動級處理器,AMD對其定義為“完整的、無妥協的AI PC解決方案”,再加上它的型號中直接帶有“AI”字樣,足見AMD對AI領域的重視。
先前,我們對新處理器的命名規則做過解釋,這裡不妨再來回顧一下:
以AMD銳龍AI 9 HX 370處理器為例,AMD 銳龍AI是品牌名,從中不難看出AMD著重強化了AI屬性。接下來的9 HX代表了處理器的等級,數字越大性能越強,尾綴的37代表系列,0代表SKU。除了銳龍AI 9 HX 370之外,本次銳龍AI 300系列的另一款型號為銳龍AI 9 365。
在台北電腦展上,AMD公佈的銳龍AI 300系列處理器包含了AMD銳龍AI 9 HX 370以及銳龍AI 9 365兩個型號,本次活動並未公佈更多新的型號,因此首發陣容方面大概率就是這兩款處理器了。前者採用12核心24線程設計,加速頻率最高5.1GHz,總緩存36MB,NPU算力提升到了50TOPS,iGPU升級到了Radeon 890M。後者則是10核心20線程處理器,加速頻率最高為5GHz,總快取34MB,NPU算力同樣為50TOPS,iGPU型號為Radeon 880M。
銳龍AI 300系列處理器將為輕薄本、遊戲本、設計師電腦、商務和中小企業筆記型以及行動工作站這些主流設備提供支持,體現了其設備生態的多樣性。
性能方面,AMD銳龍AI 9 HX 370對比英特爾酷睿Ultra 9 185H以及高通驍龍X Elite X1E-84-100,在PCMark10、UL Procyon等生產力性能方面都有明顯優勢。
另外大家喜聞樂見的CINEBENCH單核心/多核心性能方面,銳龍AI 9 HX370相比競品而言也有著更亮眼的表現,尤其在多核心性能方面實現全面領先。此外在Blender 3D渲染效能方面,銳龍AI 9 HX 370實現了高達3.8倍極大幅度的領先。
遊戲效能方面,得益於RDNA 3.5架構的全新Radeon iGPU,銳龍AI 300系列處理器相比競品也有著顯著優勢,在《孤島驚魂6》、《古墓奇兵:暗影》、《無主之地3》、《GTAV》、《Cyberpunk2077》等主流遊戲上表現優異,可以為玩家帶來更流暢的遊戲體驗。
作為“無妥協的AI PC解決方案”,銳龍AI 300系列處理器與行業夥伴深度合作,為Copilot+PC提供性能強大的硬體解決方案,深度支援各類系統級AI應用,同時更好地賦能Acer、華碩、惠普等OEM廠商的各類自研AI應用。
此外,非常好用的AIGC軟體AMUSE的2.0 Beta版本也將在7月28日上線,這是一款支援文生圖、圖生圖、繪畫生圖的超級簡單好用的AIGC工具,其繪畫生圖功能將適合搭載銳龍AI 300系列處理器的華碩靈耀16 Air的觸控筆功能,讓AI繪畫更加簡單。
整體來說,銳龍AI 300系列處理器擁有完全的生態系統相容性,有著完整的PC類型組合,全方位支援Copilot以及第三方AI軟體,同時具備優異的性能表現以及全天候的續航能力。
·RDNA 3.5以及XDNA 2讓iGPU與NPU性能顯著提升
在銳龍AI 300系列處理器平台中,有兩大非常重要的架構更新,一個是針對iGPU的RDNA 3.5,另一個是針對NPU的XDNA 2。再加上針對CPU的Zen 5,三大架構革新,讓銳龍AI 300系列處理器真正成為「無妥協的AI PC解決方案」。
首先,基於RDNA 3.5架構的全新iGPU讓人頗期待。目前來看,它主要包含Radeon 890M和Radeon 880M兩種型號。新架構計算單元升級到了16個,優化了每瓦的性能表現,優化了每bit的性能表現,同時透過優化電源管理帶來更長的電池續航力。
架構優化之後,銳龍AI 300系列處理器的iGPU圖形效能獲得了較明顯的提升。在3DMark TimeSpy以及Night Raid測試中,相較於上一代而言,在相同的15W功耗下,圖形效能分別提升32%以及19%。
XDNA 2架構則為銳龍AI 300系列處理器的NPU帶來了指數級的性能提升,這使其算力達到了50 TOPS,相比現役的銳龍8040系列的16 TOPS而言是指數級增長。
對AI PC來說,NPU的重要性伴隨著大模型規模和多樣性成長顯得越來越重要,它已成為AI PC系統不可或缺的一部分。全新的NPU在AI模型算力方面帶來了高達35x的每瓦效能提升,這使得基於銳龍AI 300系列處理器打造的AI PC具備更有效率的AI運算能力。
根據AMD官方資訊來看,2024年將有超過150家AI賦能的、不同應用領域的ISV為新一代AI PC帶來全新體驗。
此外,銳龍AI 300系列處理器的NPU支援Block FP16資料型態。它兼顧了INT8的速度與FP16的精度,相比快而不精確的INT8以及精確而不夠快的FP16來說優勢明顯。在目前絕大多數AI應用都採用16-bit設計的情況下,銳龍AI 300系列處理器可以為這些應用提供既快速又精確的運算體驗。
·結語
透過Zen 5、RDNA 3.5以及XDNA 2三大核心架構革新,AMD借助其架構的靈活性與可擴展性,為該行業帶來了包括桌面級、移動級以及伺服器終端設備的全新銳龍處理器平台覆蓋,在生產力、內容創作、遊戲、AI計算等方面為用戶帶來了全新體驗,同時透過多種形態的終端設備觸達各行各業,為不同領域、不同需求的用戶提供了極其豐富的選擇。這些基於底層架構的革新,讓我們看到了AMD在晶片領域的超凡技術實力。
後續,我們將針對全新的銳龍9000系列桌面級處理器,以及基於銳龍AI 300系列處理器平台的AI PC新品進行全面測評,並預計將在7月底或8月初上線詳細評測內容,敬請期待!