Hot Chips 34:擺脫x86束縛英偉達詳解Grace服務器CPU設計
在Hot Chips 大會期間,英偉達詳細介紹了該公司的Grace CPU 設計。作為一種經典意義上的中央處理器,其旨在取代英特爾至強(Xeon)/ AMD 霄龍(EPYC)競品,以在預先構建的高性能計算(HPC)服務器中扮演串行處理的角色—— 因為每台服務器的六張GPU 加速卡需要通過CPU 進行互連。
(通過WCCFTech)
據悉,該公司不僅研究了CPU 層面的I/O 與機器架構的瓶頸,還意識到了其計算服務器需要專門為這樣的應用場景而定制中央處理器。
得益於針對NVIDIA API 的高度架構優化,Grace CPU 就此應運而生。
作為該公司首款服務器CPU 產品,其效用可與Intel / AMD競品一較高下。
作為一款單芯片,其採用了台積電N4(4nm EUV)工藝製造,且英偉達將帶有一兩顆Grace CPU + 一顆H100 的板子稱作Superchip 或Grace Hopper 超級芯片。
可知每個Grace CPU 包含了一個900 GB/s 的交換結構,以及一個帶寬達到PCIe 5.0 x16 七倍的Coherent Interface 接口。
後者也是將相伴的H100 或節點上相鄰的超級芯片、與一致的內存訪問連接起來的關鍵。
Grace CPU 的串行處理能力,由72 核心的ARM v9 64-bit CPU 提供,而一枚超級芯片則包含了144 個核心。
主內存採用了LPDDR5x 接口(支持ECC),每個’插槽’的帶寬高達1 TB/s —— 媲美超過24 個通道的DDR5 方案。
此外具有68 條PCIe 5.0 扮演了關鍵的串行IO 接口角色,其主要被用於連接NVMe 存儲設備,且芯片的標稱峰值TDP 功耗達到了500W 。
隨著Grace CPU 的亮相,英偉達展示了該公司為企業和HPC 應用場景設計大型多核處理器方面的強大工程實力。TechPowerUp指出:
鑑於ARM 已大幅縮小與x86-64 平台的性能、效率和IPC 表現差距,我們也不難理解綠廠為何沒能拿到藍廠的x86 許可,原本它有望交付出與英特爾相媲美的企業級處理器。
即便如此,英偉達的DGX 計算節點、以及後續的更多預構建工作站/ 服務器(涵蓋眾多應用場景),勢必將逐漸擺脫傳統x86 CPU、並用Grace 及其繼任者取而代之。