128核心CPU問世:12通道DDR5+PCIe5.0、性能超頂級Intel至強
2016年才成立的斯洛伐克創業公司Tachyum今天拋出一枚重磅炸彈,宣布了全新的128核心Prodigy處理器,號稱“性能可超越Intel最快的至強,同時功耗僅有十分之一” 。首先說一下Tachyum的背景:這家公司設立在斯洛伐克,並得到過斯洛伐克政府1700萬美元投資,但幾位創始人都是美國人,且大有來頭。
尤其是CEO Radoslav Danilak,擁有25年的半導體行業經驗,一度大紅大紫的SSD主控巨頭SandForce就是他創立的,還親自擔任CEO,後被希捷收購,後來又創立了Skyera,繼續研究SSD主控技術,2014年又被西數收購。
Tachyum Prodigy號稱是全球第一顆“通用處理器”(universal processor),因為它在單獨一顆矽片內,集成了通用目的處理器、高性能計算、AI人工智能、DML深度機械學習、可解釋人工智能(Explainable AI)、生物人工智能(Bio AI)等等,基於並行多處理器環境,可簡化編程模型和環境。
最新的頂級型號為Prodigy T6128,單路單芯片集成128個物理核心,亂序執行架構,每時鐘週期4條指令,支持64位尋址、512位矢量操作、AI/ML矢量和矩陣乘法加速、虛擬化、高級RAS,運行頻率最高4GHz。
緩存方面,每個核心32KB一級指令緩存、32KB一級數據緩存,均支持ECC,末級緩存共享64MB,支持DECTED ECC。
內存方面,支持12個通道的DDR4、DDR5,最高頻率DDR5-4800,但每通道只能有一條內存條,單條最大容量512GB,合計最大6TB,並支持高級糾錯和RAS。
IO方面,集成了多達36個PCIe 5.0控制器,最多48條通道,同時還集成了兩組400G(40萬兆)以太網控制器。
更驚人的是,所有這些強大的規格,在台積電7nm工藝的加持下,封裝面積才不過85×85平方毫米,略大於Intel LGA2066的酷睿,但小於AMD SP3的線程撕裂者。
Tachyum沒有披露Prodigy的具體架構,不知道基於RISC-V、MIPS、ARM還是自研,只是說無論單線程還是多線程應用,都已經超越了Intel至強,但是又比ARM更小巧。
據介紹,Prodigy T6128處理器適合大規模超級計算機、大數據、大型AI應用,可提供262TFlops AI訓練和推理性能、16TFlops HPC高性能計算性能。
開發環境方面,Tachyum也提供了一系列工具,包括FPGA模擬器、軟件模擬器、二進制翻譯器、C/C++/Fortran編譯器、調試器和配置文件、TensorFlow編譯器,都在Linux操作系統下。
如果客戶不需要128核心這麼高大上的規格,Tachyum也提供64/32/24/16核心等不同配置。
64核心的有兩款型號,一個是T864,支持八通道DDR4/DDR5內存、72條PCIe 5.0通道、兩組400G以太網、兩組HBM3(可選)、32MB完全一致性二級/三級緩存,運行頻率4GHz,核心電壓0.8V,熱設計功耗180W,核心面積290平方毫米,封裝面積66×66平方毫米,可以取代單路/雙路的至強E7、至強E5。
另一個是TH24,專供AI/HPC,四通道DDR5和/或32GB HBM3,後者可作為緩存也可以是獨立內存,需要高精密水冷。
32核心的型號為T432,四通道DDR4,32條PCIe 4.0,兩組100G以太網。16核心的則是T216,雙通道DDR4,32條PCIe 4.0,兩組50G以太網。二者都是小尺寸封裝,成本和價格低廉,適合取代至強E5、至強E3、至強D系列。
當然,這些產品大部分都還在紙面上,目前隻流片成功了64核心的T864,預計今年內投入量產。