AMD透露了Nvidia DGX A100系統更多細節
AMD和Nvidia在技術上的競爭由來已久,所以這可能會讓人感到意外。AMD剛剛公佈了Nvidia基於Ampere的DGX A100 AI系統更多規格。Nvidia上個月以A100 GPU的形式披露了其Ampere GPU架構。它基於7nm工藝,專為雲計算、人工智能和科學數字計算而設計,擁有540億個晶體管、6912個CUDA核心,速度是之前Volta解決方案的20倍。
該公司的DGX A100系統採用8個新GPU與AMD的兩顆Epyc 7742處理器配對。這些運行速度高達3.4GHz的Zen 2 CPU,讓系統共有128個核心和256個線程。因為合作關係,Nvidia允許AMD進一步分享DGX A100系統的細節。
AMD數據中心生態系統和應用工程公司副總裁Raghu Nambiar表示,只有第二代AMD EPYC處理器才能在單個x86數據中心處理器中提供多達64個核心和128條PCIe 4互聯通道,我們很高興看到Nvidia DGX A100系統強大功能如何使I/O帶寬有效地翻倍。
DGX A100使用600 GB/s NVSwitch鏈路連接8個A100 GPU,幫助提供5 petaflops的計算性能,它還配備了320GB的GPU內存,帶寬為每秒12.4 TB。DGX A100價格達到$19萬9千美元。Nvidia副總裁兼DGX系統總經理Charlie Boyle表示,Nvidia DGX A100在性能和功能方面實現了巨大的飛躍,DGX A100所使用的第2代AMD Epyc處理器提供了高性能和對PCIe Gen4的支持。Nvidia將這些功能用於打造世界上最強大的AI系統,同時保持與整個DGX系列所使用的GPU優化軟件棧的兼容性。
至於為什麼Nvidia選擇了競爭對手的CPU,而不是英特爾的CPU,Nvidia表示,英特爾的Xeon芯片是首批DGX系統的首選處理器,但是,Epyc處理器提供的額外功能和性能使其成為一個簡單的選擇。為了保證系統中GPU的數據供應,我們需要一個快速的CPU,盡可能多的核心和PCI通道。我們使用的AMD CPU每顆都有64個核心,大量的PCI通道,並支持PCIe Gen4。