英偉達發布基於Ampere架構的A10/A30 Tensor Core GPU
在今日的活動上,英偉達發布了與CPU和GPU相關的諸多公告,其中就包括了面向數據中心市場、主打虛擬化平台、且基於Ampere架構的A10 / A30 Tensor Core GPU 。兩款產品分別基於GA102 / GA100 GPU核心,輔以24GB的GDDR6 / HBM2顯存。
首先介紹下Nvidia A10 Tensor Core GPU,其基於GA102-890 SKU,擁有72組SM單元/ 9216個CUDA核心。
基礎頻率855 MHz / 加速可達1695 MHz,輔以384-bit @ 24GB GDDR6 顯存(頻率12.5 Gbps)、帶寬600 GB/s,並且兼容PCIe 4.0 。
計算卡本體採用了單槽全長尺寸,輔以被動式散熱設計的香檳金色外殼(無風扇),熱設計功耗(TDP)150W,通過單8-pin外接供電。
性能方面,該卡最高可達31.2 TF FP32、62.5 TF TF32、125 TF BFLOAT16、250 TOPS INT8、500 TOPS INT4、以及兩倍的稀疏性(sparsity)。
其次是Nvidia A30 Tensor Core GPU,其基於GA100 SKU(尚不清楚確切的衍生版本)。
基礎頻率930 MHz / 加速可達1440 MHz,輔以24GB HBM2 顯存(3072-bit @ 1215 MHz),帶寬高達933 GB/s 。
與A10 不同的是,A30 採用了雙槽全長設計,TDP 高達165W,但仍可通過單8-pin 外接供電。
性能方面,該卡最高可達5.2 TF FP64、10.3 TF Peak FP64TF、10.3 TF FP32、82 TF TF32、165 TF BFLOAT16、330 TOPS INT8、661 TOPS INT4、以及兩倍的稀疏性。
合作夥伴之一的浪潮,亦推出了NF5468M6 / NF5468A5 / NF5280M6 三條服務器產品線。
其中NF5468M6主打超靈活的AI工作負載,支持雙路英特爾第三代至強可擴展處理器,8張英偉達A100 / A40 / A30 GPU、16張A10 GPU、或20張T4 GPU 。
在4U 機箱中,最多可配備12 塊3.5 英寸硬盤驅動器,可靈活適應最新的AI 加速器/ 智能NIC,輔以一鍵式切換拓補等功能,適用於AI 雲、智能視頻分析(IVA)、視頻處理等各種人工智能應用程序。
NF5468A5多功能AI服務器,其支持雙路AMD Rome / Milan CPU和8張英偉達A100 / A40 / A30 GPU,輔以N + N冗餘設計。
在全速運行時可調用8 塊350W 的AI 加速卡,能夠帶來出色的性能與可靠性。此外CPU 與GPU 之間的非阻塞設計,允許它在不經由PCIe 交換芯片的情況下實現互連通信,以實現更快的計算效率。
NF5280M6則是專為所有場景而打造的2U產品,支持雙路英特爾第三代至強可擴展處理器,4張英偉達A100 / A40 / A30 / A10 GPU或8張T4 Tensor Core GPU,可在45℃下長期穩定運行。
該計算卡配備了最新的PFR / SGX 技術和可信賴的安全模塊設計,適用於要求苛刻的各種AI 應用。
浪潮還宣布了全新的M6 AI 服務器,將英偉達Bluefield-2 DPU 完全集成到了該公司的下一代AI 服務器中。
可為人工智能、大數據分析、雲計算等場景,提供更快、更高效的用戶/ 集群管理,以及互連數據的訪問/ 虛擬化。
目前全球製造商已經提供了20 多套經過英偉達認證的系統,預計各大製造商配備A30 / A10 GPU 的新產品將於今年晚些時候上市。
最後,Nvidia AI Enterprise 採用了永久授權模式,單路CPU 插槽的報價為3595 美元,此外企業標準業務支持的年費為899 美元。
感興趣的客戶,亦可在計劃升級到VMware vSphere 7 Update 2 的時候,申請NVIDIA AI Enterprise 的早期訪問。