AMD Radeon Instinct MI100 CDNA計算卡FP32性能超越英偉達A100
近日,WCCFTech分享了有關CDNA GPU架構的AMD Radeon Instinct MI100計算卡的性能參數。與英偉達A100相比,MI100計算卡在FP32算力和性價比上都給我們留下了深刻的印象。不過另一方面,MI100在人工智能(AI)和高性能計算(HPC)上仍被英偉達Ampere超越。
(組圖via WCCFTech)
除了據說來自AMD官方演示的Radeon Instinct MI100幻燈片,AdpredTV還展示了英偉達Volta和Ampere GPU的基準測試對比。
早前有文章稱,AMD Radeon Instinct MI100 GPU 將於2020 下半年投放市場。不過AdoredTV 最新分享的幻燈片表明,AMD 及其合作夥伴還有服務器領域的後續計劃。
首先,AMD 計劃推出一款面向高性能計算的定制服務器。其採用了2P 設計,基於雙路霄龍CPU 平台,可選上一代Rome 或最新的Milan 芯片。
每顆霄龍CPU 都通過第二代Infinity Fabric 互連方案,與兩塊Radeon Instinct MI100 加速卡連接。單卡熱設計功耗300W,四路配置可提供136 T-Flops 的FP32(SGEMM)算力。
其它規格包括支持256 GB/s 的PCIe 4.0,四卡組合的內存容量128GB、帶寬4.9 TB/s 。單卡具有32GB 的HBM2e 顯存,帶寬1.225 TB/s 。標準配置或無緣XGMI,並將僅限於1U 機架版本。
至於上市時間,據說配備AMD霄龍(Rome / Milan)的高性能1U服務器會在2020年12月推出,基於英特爾至強CPU平台的衍生版本也有望在2021年2月發布。
其次是一款AMD Radeon Instinct MI100 3U 服務器,其具有更強大的規格,比如支持為兩顆霄龍CPU 連接八張MI100 計算卡。基於XGMI 方案的每組4 卡可提供雙向100 GB/s 的連接和1.2 TB/s 的帶寬。
四路MI100 加速卡的FP32 算力為272 T-Flops,PCIe 帶寬512 GB/s 。HMB 顯存容量256GB,帶寬9.8 TB/s 。基於3U 外形的機架平台的總額定功率為3 kW 。
為便於評估性能,AdoredTV 還將MI100 計算卡和英偉達公司的Volta V100 / Ampere A100 GPU 加速卡進行了比較。後者俱有XSM 的外形尺寸,並提供400W / 250W 兩種PCIe 接口版本。
基準測試表明,Radeon Instinct MI100 計算卡的FP32 性能較英偉達Ampere A100 方案高出約13%、同時更是Volta V100 GPU 的兩倍以上。
性價比方面,MI100 是V100S 的2.4 倍、較Ampere A100 高出50% 。即使在Resenet 配置中納入32 張計算卡,性能的縮放也幾乎是線性的,給我們留下了相當深刻的印象。
最後,PPT 中還提到AMD 將在三大領域提供更好的性能/ 價值,包括石油天然氣、學術研究、以及高性能計算/ 機器學習。
不過在FP64 計算、人工智能和數據分析等其它類型的HPC 工作負載中,英偉達100 加速卡依然具有更出色的性能。此外與AMD 相比,英偉達還擁有多實例GPU 架構等方面的優勢。
得益於在Ampere A100 GPU 上使用了最新一代的Tensor 內核,其FP64 / FP16 / 張量性能指標分別提升2.5 / 2 / 2 倍。