英偉達發布基於Ampere架構的A10/A30 Tensor Core GPU

在今日的活動上，英偉達發布了與CPU和GPU相關的諸多公告，其中就包括了面向數據中心市場、主打虛擬化平台、且基於Ampere架構的A10 / A30 Tensor Core GPU 。兩款產品分別基於GA102 / GA100 GPU核心，輔以24GB的GDDR6 / HBM2顯存。

首先介紹下Nvidia A10 Tensor Core GPU，其基於GA102-890 SKU，擁有72組SM單元/ 9216個CUDA核心。

基礎頻率855 MHz / 加速可達1695 MHz，輔以384-bit @ 24GB GDDR6 顯存（頻率12.5 Gbps）、帶寬600 GB/s，並且兼容PCIe 4.0 。

計算卡本體採用了單槽全長尺寸，輔以被動式散熱設計的香檳金色外殼（無風扇），熱設計功耗（TDP）150W，通過單8-pin外接供電。

性能方面，該卡最高可達31.2 TF FP32、62.5 TF TF32、125 TF BFLOAT16、250 TOPS INT8、500 TOPS INT4、以及兩倍的稀疏性（sparsity）。

其次是Nvidia A30 Tensor Core GPU，其基於GA100 SKU（尚不清楚確切的衍生版本）。

基礎頻率930 MHz / 加速可達1440 MHz，輔以24GB HBM2 顯存（3072-bit @ 1215 MHz），帶寬高達933 GB/s 。

與A10 不同的是，A30 採用了雙槽全長設計，TDP 高達165W，但仍可通過單8-pin 外接供電。

性能方面，該卡最高可達5.2 TF FP64、10.3 TF Peak FP64TF、10.3 TF FP32、82 TF TF32、165 TF BFLOAT16、330 TOPS INT8、661 TOPS INT4、以及兩倍的稀疏性。

合作夥伴之一的浪潮，亦推出了NF5468M6 / NF5468A5 / NF5280M6 三條服務器產品線。

其中NF5468M6主打超靈活的AI工作負載，支持雙路英特爾第三代至強可擴展處理器，8張英偉達A100 / A40 / A30 GPU、16張A10 GPU、或20張T4 GPU 。

在4U 機箱中，最多可配備12 塊3.5 英寸硬盤驅動器，可靈活適應最新的AI 加速器/ 智能NIC，輔以一鍵式切換拓補等功能，適用於AI 雲、智能視頻分析（IVA）、視頻處理等各種人工智能應用程序。

NF5468A5多功能AI服務器，其支持雙路AMD Rome / Milan CPU和8張英偉達A100 / A40 / A30 GPU，輔以N + N冗餘設計。

在全速運行時可調用8 塊350W 的AI 加速卡，能夠帶來出色的性能與可靠性。此外CPU 與GPU 之間的非阻塞設計，允許它在不經由PCIe 交換芯片的情況下實現互連通信，以實現更快的計算效率。

NF5280M6則是專為所有場景而打造的2U產品，支持雙路英特爾第三代至強可擴展處理器，4張英偉達A100 / A40 / A30 / A10 GPU或8張T4 Tensor Core GPU，可在45℃下長期穩定運行。

該計算卡配備了最新的PFR / SGX 技術和可信賴的安全模塊設計，適用於要求苛刻的各種AI 應用。

浪潮還宣布了全新的M6 AI 服務器，將英偉達Bluefield-2 DPU 完全集成到了該公司的下一代AI 服務器中。

可為人工智能、大數據分析、雲計算等場景，提供更快、更高效的用戶/ 集群管理，以及互連數據的訪問/ 虛擬化。

目前全球製造商已經提供了20 多套經過英偉達認證的系統，預計各大製造商配備A30 / A10 GPU 的新產品將於今年晚些時候上市。

最後，Nvidia AI Enterprise 採用了永久授權模式，單路CPU 插槽的報價為3595 美元，此外企業標準業務支持的年費為899 美元。

感興趣的客戶，亦可在計劃升級到VMware vSphere 7 Update 2 的時候，申請NVIDIA AI Enterprise 的早期訪問。

WONGCW 網誌