AMD EPYC 9005系列領先架構大揭秘首次採用三種不同工藝
最近,AMD正式發布了第五代Turin EPYC 9005系列,在前四代的紮實基礎上,製程架構、規格性能等各方面立體化升級,再次取得「遙遙領先」。發表會後,快科技訪問了AMD伺服器部門高層Ravi Kuppuswamy、Madhu Rangarajan等人,對EPYC 9005系列的更深入細節做了一番交流。
首先談談EPYC 9005系列的製程問題。
上一代的EPYC 9004/8004系列,都是基於5/6nm工藝,也就是CCD計算模組是5nm,IOD輸入輸出模組是6nm。
這一代則升級使用了3/4/6nm三種不同的工藝,其中IOD模組還是6nm(但內部進行了升級),CCD模組首次分為兩種:Zen 5版本採用的是4nm,Zen 5c版本採用的是3nm。
為何如此區分?原因其實很簡單,更先進的製程可以讓Zen 5c CCD模組在有限的晶片面積內塞入更多模組、更多核心。
Zen 5部分的CCD每個內部還是8核心,但是CCD數量從上代的12個增加到16個,得以從最多96核心192線程增至最多128核心256線程。
Zen 5c部分的CCD每個內部依舊是16核心,CCD數量則從8個增至12個,上代的最多128核心256線程,就變成了空前的最多192核心384線程,創下x86處理器新紀錄。
其次是架構方面。
上一代EPYC首次引入了Zen 4、Zen 4c兩種架構版本,並劃分Genoa EPYC 9004系列、Bergamo 97×4系列兩條產品線,後者進一步延伸出了Siena EPYC 8004系列。
新一代EPYC在延續這設計的同時,也對產品體係做了調整。
EPYC 9005系列進化為Zen 5、Zen 5c兩種版本,一如上代,它們倆並非傳統的所謂“大小核”,而依然是完全相同的架構、IPC性能、ISA指令集,一二三級緩存總量也相同,唯一的差別還是後者的核心更多,所以其每核心的三級快取小一些。
事實上,無論Zen 5或Zen 5c,整顆晶片的最大三級快取總量是相同的,但由於Zen 5c的每個CCD內擁有兩倍於Zen 5的核心數,因此分配到的三級緩存少一些,每個核心最多32MB。
這麼做的好處是Zen 5c可以容納更多核心,支援更高密度運算,同時與Zen 5共享系統平台,對於作業系統和應用軟體來說也不需要特殊的適配和最佳化,大大降低客戶成本,加速普及。
需要強調的是,如果跨CCD存取三級緩存,延遲會變得非常高,大大影響性能,因此AMD沒有做三級緩存的跨CCD全共享設計,每個CCD內的核心只訪問自己的三級快取.
如果仔細看EPYC 9005系列會發現Zen 5、Zen 5c都在其中,沒有刻意劃分(甚至產品代號都同為“Turin“),不像上代分為不同產品系列。
AMD發言人對此表示,上代的Genoa、Bergamo是分不同時間發布的,但是Zen 5、Zen 5c是同時發布的,基於統一的產品棧,所以它們就是在一起的。
AMD也貼心地提供了詳細的產品列表,展示不同的SKU型號,可以看到不同的主頻、不同的快取、不同的功耗。
如果一定要區分也簡單,8-72核心的都是Zen 5,144-192核心的都是Zen 5c,96/128核心的編號9×55的為Zen 5、編號9×45的為Zen 5c。
另外,IOD雖然製程沒變,但內部做了升級,主要是提升了記憶體控制器、記憶體速度,以及IOD/CCD核心之間的溝通,可以理解為在I/O物理層與核心之間的互連性能會更好。
但是,AMD並沒有在IOD內整合專門的AI加速器,因為AMD發言人表示,這樣會增加晶片面積和功耗,也會吃掉記憶體頻寬,如果需要AI加速,用更專業的GPU就好了,例如AMD自家的Instinct MI系列,它們的表現會更好。
AMD發言人說到,GPU擁有每美元的最佳AI效能,而CPU能實現每美元的最佳通用運算效能。