AMD Radeon Instinct MI100 CDNA計算卡FP32性能超越英偉達A100

2020-07-30 Comments 0 Comment

近日，WCCFTech分享了有關CDNA GPU架構的AMD Radeon Instinct MI100計算卡的性能參數。與英偉達A100相比，MI100計算卡在FP32算力和性價比上都給我們留下了深刻的印象。不過另一方面，MI100在人工智能（AI）和高性能計算（HPC）上仍被英偉達Ampere超越。

（組圖via WCCFTech）

除了據說來自AMD官方演示的Radeon Instinct MI100幻燈片，AdpredTV還展示了英偉達Volta和Ampere GPU的基準測試對比。

早前有文章稱，AMD Radeon Instinct MI100 GPU 將於2020 下半年投放市場。不過AdoredTV 最新分享的幻燈片表明，AMD 及其合作夥伴還有服務器領域的後續計劃。

首先，AMD 計劃推出一款面向高性能計算的定制服務器。其採用了2P 設計，基於雙路霄龍CPU 平台，可選上一代Rome 或最新的Milan 芯片。

每顆霄龍CPU 都通過第二代Infinity Fabric 互連方案，與兩塊Radeon Instinct MI100 加速卡連接。單卡熱設計功耗300W，四路配置可提供136 T-Flops 的FP32（SGEMM）算力。

其它規格包括支持256 GB/s 的PCIe 4.0，四卡組合的內存容量128GB、帶寬4.9 TB/s 。單卡具有32GB 的HBM2e 顯存，帶寬1.225 TB/s 。標準配置或無緣XGMI，並將僅限於1U 機架版本。

至於上市時間，據說配備AMD霄龍（Rome / Milan）的高性能1U服務器會在2020年12月推出，基於英特爾至強CPU平台的衍生版本也有望在2021年2月發布。

其次是一款AMD Radeon Instinct MI100 3U 服務器，其具有更強大的規格，比如支持為兩顆霄龍CPU 連接八張MI100 計算卡。基於XGMI 方案的每組4 卡可提供雙向100 GB/s 的連接和1.2 TB/s 的帶寬。

四路MI100 加速卡的FP32 算力為272 T-Flops，PCIe 帶寬512 GB/s 。HMB 顯存容量256GB，帶寬9.8 TB/s 。基於3U 外形的機架平台的總額定功率為3 kW 。

為便於評估性能，AdoredTV 還將MI100 計算卡和英偉達公司的Volta V100 / Ampere A100 GPU 加速卡進行了比較。後者俱有XSM 的外形尺寸，並提供400W / 250W 兩種PCIe 接口版本。

基準測試表明，Radeon Instinct MI100 計算卡的FP32 性能較英偉達Ampere A100 方案高出約13％、同時更是Volta V100 GPU 的兩倍以上。

性價比方面，MI100 是V100S 的2.4 倍、較Ampere A100 高出50% 。即使在Resenet 配置中納入32 張計算卡，性能的縮放也幾乎是線性的，給我們留下了相當深刻的印象。

最後，PPT 中還提到AMD 將在三大領域提供更好的性能/ 價值，包括石油天然氣、學術研究、以及高性能計算/ 機器學習。

不過在FP64 計算、人工智能和數據分析等其它類型的HPC 工作負載中，英偉達100 加速卡依然具有更出色的性能。此外與AMD 相比，英偉達還擁有多實例GPU 架構等方面的優勢。

得益於在Ampere A100 GPU 上使用了最新一代的Tensor 內核，其FP64 / FP16 / 張量性能指標分別提升2.5 / 2 / 2 倍。

WONGCW 網誌

記錄生活經驗與點滴

AMD Radeon Instinct MI100 CDNA計算卡FP32性能超越英偉達A100

2020-07-30 Comments 0 Comment

相關

發表迴響取消回覆

2020 年 7 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

分享此文：

相關

發表迴響取消回覆