AMD發布6nm MI210計算卡:64GB HBM2e顯存、300W功耗
去年11月,AMD發布了CDNA2新架構的新一代加速計算卡Instinct MI250X、MI250,升級6nm工藝、2.5D MCM雙芯整合封裝、第三代Infinity Fabric總線互連技術,集成最多14080個流處理器核心、880個矩陣核心、218GB HBM2e顯存/內存。
兩款卡均採用OAM模塊形態,現在終於增加了PCIe標準形態,型號“Instinct MI200”,支持PCIe 4.0。
MI200回歸單芯封裝,規格、性能幾乎完全就是MI250砍去一半:291億個晶體管,104組計算單元,6656個流處理器核心,416個矩陣核心,4096-bit 64GB HBM2e顯存,三條Infinity Link互連總線(最多四塊並行)。
核心頻率還是1.7GHz,性能也正好減半,FP64/FP32矢量算力22.6TFlops,FP64/FP32矩陣算力45.3TFlops,FP16矩陣算力181TFlops,INT8矩陣算力181Tops。
顯存頻率也維持在3.2GHz,所以帶寬減半1.6TB/s。
整卡功耗從560W降到了300W,採用單個EPS12V 8針輔助供電接口,被動散熱。
軟件API支持OpenMP、OpenCL、HIP,計算框架支持TensorFlow、PyTorch、Kokkos、RAJA。
Instinct MI200 PCIe已經出貨,方案客戶包括華碩、戴爾、超微、慧與、聯想。
與此同時,AMD還發布了ROCm 5開發套件,硬件新增支持Instinct MI200系列計算卡、Radeon PRO W6800專業顯卡,系統新增支持Red Hat Enterprise Linux 8.5,商業ISV合作夥伴新增Ansys Cascade、TempoQuest,不僅提高了開發者的可用性,還在各種關鍵負載中實現了更出色的性能。
ROCm 5的應用程序支持還包括HPC、AI、機器學習應用程序,以及AMBER、Chroma、CP2K、GRID、GROMACs、LAAMPS、MILC、Mini-HAAC、NAMD、NAMD 3.0、ONNX-RT、OpenMM、PyTorch、RELION、SPECFEM3D Cartesian、SPECFEM3D Globe、TensorFlow。