NVIDIA公佈2026-2028年兩大GPU架構:搭配1TB HBM4e內存
NVIDIA Blackwell架構雖然在加速卡、遊戲卡上都遭遇諸多波折,但這並不影響NVIDIA對於未來的宏偉規劃,不但公佈了下一代Rubin架構的具體產品規劃,還首次宣布了再下一代架構「Feynman」。

Feynman就是理查德·費曼,美籍猶太裔人,20世紀最偉大的物理學家之一,諾貝爾物理學獎獲得者,在量子電動力學、量子計算、納米技術等領域都有開創性的成就,還撰寫了《費曼物理學講義》、提出了“費曼學習法”,1986年挑戰者號飛機爆炸失事的根本原因也是他的。

NVIDIA這次一共宣布了三款產品,首先是“ Blackwell Ultra NV72 ”,今年下半年發布,每個節點配備兩顆升級版的Blackwell GPU、一顆Grace CPU,搭配多達288GB HBM3e高頻寬內存,Dense FP4性能高達15PFlops(每秒1.5億次)。
整台伺服器共72個節點,也就是144顆GPU、72顆CPU、20TB HBM3e、40TB DDR5內存,比上代增加50%,CX8互連頻寬14.4TB/s,增加100%。
整機的Dense FP4推理性高達1.1EFlops(每秒110億億次),FP8訓練性能高達0.36EFlps(36億億次),還有新的注意力指令。

2026年下半年,我們將迎來全新的Rubin架構,首發伺服器產品為“ Vera Rubin NV144 ”,每個節點兩顆Rubin GPU搭配一顆全新的Vera CPU。
其中,R ubin GPU搭配288GB容量的下一代HBM4內存,FP4浮點效能躍升到50PFlops(每秒5億億次)。
Vera CPU則包含88個自研Arm架構核心,首次支援多線程而達到176線程,彼此之間透過1.8TB/s頻寬的NVLink-C2C匯流排連接在一起。
整台伺服器總共144個節點,也就是288顆GPU、144顆CPU、41.5TB HBM4內存(頻寬13TB/s),還有75TB的系統內存,NVLink6頻寬達260TB/s,CX9匯流排頻寬達28.8TB/s。
FP4推理表現來到3.6EFlops(每秒360億億次),FP8訓練表現則是1.2EFlops(每秒120億億次)。

2027年下半年,我們將看到升級版的“ Rubin Ultra NV576 ”,每個節點包含四顆Rubin GPU、一顆Vera GPU,並升級1TB HBM4e內存,FP4浮點性能高達100PFlops(10億億次)。
整機總共多達576個節點,也就是擁有2304顆Rubin GPU、576顆Vera CPU、576TB HBM5e(頻寬4.6PB/s),還有365TB系統記憶體。
NVLink互連匯流排升級至第七代NVLink7,頻寬驚人的1.5PB/s,另外CX9匯流排頻寬115.2TB/s。
FP4推理表現高達15EFlops(每秒1500億億次),FP8訓練表現5EFlops(每秒500億億次)。

至於新的Feynman架構,將在2028年首次登場,搭配下一代HBM內存(HBM5?),但具體細節暫未披露。
