白皮書揭示了英偉達Hopper大芯片的關鍵規格
為英偉達下一代H100 加速卡提供支撐的GH100 芯片,紙面規格已經讓人感到十分驚訝。不過週末曝光的白皮書,又讓我們對其有了更深入的了解。據悉,綠廠正在積極利用台積電的N4(4nm 級EUV)先進工藝來構建Hopper GPU,而H100 大芯片更是被六個HBM3 高帶寬顯存堆棧給環繞著。
(圖via ComputerBase.de)
TechPowerUp指出:GH100 計算芯片擁有800 億個龐大的晶體管數量,較GA100 增加近50% 。
Hopper GPU 的流處理器設計
有趣的是,在4nm EUV 工藝的加持下,GH100 的芯片面積卻只有814 m㎡,小於基於7nm DUV(台積電N7 工藝)節點製造的GA100(826 m㎡)。
Ampere GPU 的流處理器設計
由圖可知,英偉達GH100 的組件層次結構與上一代類似,主要數學運算部分被佈置到了144 組流處理器(SM)上。
GH100 擁有18432 個FP32(單精度)/ 9216 個FP64 (雙精度)CUDA 核心,輔以576 個第四代Tensor 核心,此外矽片上其中一組GPC 具有光柵圖形單元。
鑑於GH100 具有6144-bit 的HBM3 顯存位寬,英偉達或為其標配80GB VRAM,預計帶寬可超3 TB/s(且有ECC 加持)。
主機接口也迎來了重大升級,且SXM 外形的PCB 板上配備了最新一代NVLink 界面(具有900 GB/s 的帶寬)。
AIC 插卡版本則是採用了PCIe 5.0 x16(128 GB/s)接口,且兩者都引入了資源池(resource-pooling)功能。
最後,英偉達正在用更高的功耗來壓榨更多的性能—— 可知H100 的典型功率值為700W,而A100 僅為400W 。
不過H100 並非滿血SKU,即使高密度的SXM 外形版本,也只啟用了144 組SM 單元中的132 個。
PCIe 插卡版本更是僅啟用了114 個SM 單元,且兩者的最高時鐘速率都是1.80 GHz 。