NVIDIA發布PCIe版安培計算卡:功耗驟降150W、性能20倍於上代
5月中旬,NVIDIA正式發布了全新一代“安培”(Ampere) GPU架構、GA100 GPU核心,並宣布了首款產品“A100”加速計算卡,採用專有的SMX4形態。今天,基於標準PCIe形態的A100計算卡登場了,更適合主流標準服務器。
PCIe A100仍然基於GA100核心,規模保持不變,還是台積電7nm工藝、826平方毫米、542億個晶體管,提供6912個FP32 CUDA核心,最高加速頻率也是1.41GHz,因此峰值性能相同:單精度19.5TFlops、雙精度9.7TFlops、INT8推理1248Tops、INT8張量624Tops、FP16張量312TFlops、FP32張量156TFlops、FP32訓練312TFlops、FP64高性能計算19.5TFlops。
NVIDIA宣稱,相比於上代Volta伏特架構的V100計算卡,INT8推理性能、FP32訓練性能都實現了20倍的提升,FP64高性能計算也提升了2.5倍,是歷史上進步最大的一次。
顯存依然搭配40GB HBM2,512-bit位寬,2.4GHz頻率,1.6TB/s帶寬。
由於散熱限制,熱設計功耗從SMX4版本的400W大大降低到了250W,如此還能維持相同的峰值性能堪稱奇蹟,當然實際負載持續性能顯然無法做到滿血,但官方表示仍能有大約90 %。
另外一點不同就是多卡並聯,SMX4版本支持最多八塊並行,PCIe則只能兩塊並行,NVLink互連總線顯然做了精簡,但具體未披露,可能從12條砍半至6條。
NVIDIA沒有披露PCIe A100計算卡的出貨時間和價格,應當會很快。AMD霄龍無疑仍然還是其最佳搭檔,後者仍是唯一支持PCIe 4.0的數據中心平台。