NVIDIA更新Hopper H100規格:性能比預期更強悍
NVIDIA官方公開了Hopper H100 GPU 的規格信息,性能要比預期的更加強悍。今年早些時候,NVIDIA 宣布了適用於AI 數據中心的Hopper H100 GPU,最高可以達到60 TFLOPs 和30 TFLOPs FP64。
不過伴隨著發售日期臨近,NVIDIA 再次更新了其顯卡規格,表明在性能上再次有所提升。性能指標數字得到提升的一個原因是,當芯片投入生產時,GPU 製造商可以根據實際時鐘速度最終確定數字。NVIDIA 很可能使用保守的時鐘頻率來提供初步的性能數據,隨著生產全面展開,該公司發現該芯片可以提供更好的時鐘頻率。
上個月在GTC 上,NVIDIA 證實他們的Hopper H100 GPU 正在全面生產,合作夥伴將在今年10 月推出第一波產品。還確認Hopper 的全球推廣將包括三個階段,第一個階段將是NVIDIA DGX H100 系統的預購,以及直接從NVIDIA 向客戶提供免費實驗室,這些系統包括戴爾的Power Edge 服務器等系統,現在可在英偉達啟動板。
NVIDIA Hopper GH100 GPU 由一個巨大的144 SM(流式多處理器)芯片佈局組成,共有8 個GPC。這些GPC 共有9 個TPC,每個TPC 進一步由2 個SM 單元組成。這使我們每個GPC 有18 個SM,而在完整的8 個GPC 配置中,我們有144 個。每個SM 最多由128 個FP32 單元組成,這應該給我們總共18,432 個CUDA 內核。