570億晶體管:英偉達推出新一代InfiniBand平臺Quantum-2
GTC 2021 大會期間,英偉達發佈了全新的 InfiniBand 網路平臺,它就是基於 Bluefield-3 DPU 和 Quantum-2 Infiniband 交換機的 Quantum-2 。 官方新聞稿稱,其旨在為雲計算供應商和超算中心帶來極致性能、廣泛的可訪問性、以及強大的安全性。
作為有史以來最先進的端到端網路平臺,NVIDIA Quantum-2 底層是 400Gbps 的 InfiniBand 網路。
在結合該公司的 Quantum-2 交換機、ConnectX-7 網路適配器、BlueField-3 數據處理單元(DPU),以及所有支援新架構的軟體。
Quantum-2 的帶來,正值超算中心越來越多地向組織之外的公眾開放。 與此同時,全球雲服務提供者也在為數以百萬計的客戶提供更多超級計算服務。
功能方面,Quantum-2 能夠為各個領域要求苛刻的工作負載提供其所需的關鍵性能。 在暈原生技術的支撐下,它可達成 400 Gb/s 的高性能與先進的多租戶功能。
英偉達網路高級副總裁 Gilad Shainer 表示:當今超算中心與公共雲的需求正在融合,所以必須為下一代高性能計算、人工智慧、數據分析等挑戰提供盡可能到的性能,同時必須安全地隔離工作負載並回應使用者流量的不同需求。
好消息是,在 NVIDIA Quantum-2 InfiniBand 的加持下,現代數據中心的這一願景現在成為現實。
得益於 400Gbps 的速率,Quantum-2 InfiniBand 不僅讓速度加倍、埠數量增加三倍,還可將性能提升 3 倍、讓數據中心結構交換機的需求減少至 1/6,同時降低數據中心功耗、以及讓空間佔用減少 7% 。
此外 Quantum-2 的多租戶性能隔離,可防止一個租戶的活動干擾到其他租戶。 利用具有雲原生功能、先進的基於遙測的擁塞控制系統,還可確保使用者 / 工作負載需求激增情況下的可靠輸送量。
與上一代相比,Quantum-2 SHARPv3 網路計算技術為 AI 應用程式帶來了 32 倍的加速引擎,而 UFM Cyber-AI 平臺支援數據中心的高級 InfiniBand 結構管理(包括預測性維護)。
此外集成的 ns 精度計時系統,可為分散式應用程式(比如資料庫處理)帶來更好的同步支援,有助於減少等待和空間時間開銷。 而且新功能允許雲數據中心成為電信網路的一部分,並託管軟體定義的 5G 無線服務。
規格方面,Quantum-2 平臺的核心是全新的 Quantum-2 InfiniBand 交換機。 其採用了 7nm 製程工藝,在矽片上容納了 570 億個晶體管,規模較 540 億個晶體管的 NVIDIA A100 GPU 還要龐大。
輔以 64 個 400Gbps 埠、或 128 個 200Gbps 埠的靈活搭配,能夠在各種交換機系統中提供多達 2048 個 400 Gbps / 4096 個 200 Gbps 埠的擴展能力,是上一代 Quantum-1 平臺的 5 倍以上。
結合網路速度、交換能力和可擴充性,Quantum-2 非常適合構建下一代巨型高性能計算(HPC)系統。
感興趣的客戶,能夠通過全球廣泛的領先基礎設施 / 系統供應商訂購 Quantum-2,包括 Atos、DataDirect Networks(DDN)、戴爾、Excelero、GIGABYTE、惠與、IBM、浪潮、聯想、NEC、Penguin Computing、QCT、超微(Supermicro)、VAST Data、 以及 WekaIO 。
最後,NVIDIA Quantum-2 平臺提供兩個網路端點選項,分別是 ConnectX-7 NIC 和 BlueField-3 DPU InfiniBand 。
前者採用 7nm 設計,擁有 80 億個晶體管,速率是目前業內領先的 HPC 網路晶片 NVIDIA ConnectX-6 的一倍,RDMA、GPUDirect Storage / RDMA 和網路內計算(In-Networking Computing)的性能也翻倍,預計出樣時間為 2022 年 1 月。
後者同樣基於 7nm 設計,具有 220 億個晶體管,輔以 16 個 @ 64-bit 的 ARM CPU 核心來説明卸載和隔離數據,預計出樣時間為 2022 年 5 月。