Marvell宣布OCTEON 10 DPU平台:採用ARM N2 CPU內核與5nm製程
一年多前,我們就已經聽說過美滿電子(Marvell)的OCTEON TX2基礎架構處理器。自那時起,相關生態就一直在公司內外以極快的方式在發展。今天我們要介紹的,就是Marvell最新推出的OCTEON 10系列DPU 。作為一個全新的SoC系列,其採用了台積電5nm製程工藝,且首次用上了ARM的Neoverse N2 CPU內核。
上一代的OCTEON TX 和OCTEON TX2,僅被Marvel 稱作“基礎架構處理器”。而最新的OCTEON 10 平台,則被該公司稱作DPU 加速器。這種類型的多功能芯片,旨在幫助移動和處理那些通過網絡傳輸的數據。
在OCTEON 10 身上,我們不僅看到了與上一代相同的多功能構建塊陣列,還看到了某些先進的IP、以及一些新功能。比如集成機器學習推理的引擎、內聯加密處理器、以及矢量數據包處理器,且它們都能夠以虛擬化方式運行。
值得一提的是,OCTEON 10 也是Marvell 首款採用台積電N5P 工藝製造的DPU 芯片。其不僅率先集成了ARM 的Neoverse N2 CPU 核心,還支持最新的PCIe 5.0 I/O 與DDR5 內存。
作為DPU 的重要補充,Marvell 還為OCTEON 10 引入了內部機器學習(ML)引擎。儘管去年完成的早期IP,最初是為專用型的推理加速應用而打造的。
但在激烈的市場競爭面前,該公司還是決定暫時按下不表,直到將ML 加速器集成到最新的OCTEON DPU 芯片中。
Marvel 指出,將推理加速器放到同一芯片、並直接集成到數據管道中,對於此類數據流用例所需的高吞吐量/ 低延遲處理至關重要。
與此同時,Marvel 正在為英偉達下一代BlueField-3 DPU 提供優於競爭對手的解決方案,尤其在AI 處理性能和產能等方面。
據悉,首批OCTEON 10 產品預計將於2021 年底前出樣,而英偉達BF2 則要等到2022 年。
此外OCTEON 10 新系列引入了矢量數據包處理引擎,與當前一代的標量處理引擎相比,它能夠將數據包的處理吞吐量,大幅提升至5 倍。
如前所述,OCTEON 10 DPU 系列是首款公開宣布採用ARM 最新的Neoverse N2 基礎架構的CPU IP 設計。
AnandTech 在數月前介紹過N2 與面向高性能計算的HPC V1,可知與亞馬遜Graviton2 或Ampere Altra 相比,其承諾帶來40% 的性能提升。
對於Marvell 而言,在從TX CPU 核心切換到N2 之後,其單線程性能亦有望提升3 倍。2020 年底的時候,該公司已宣布停用自家的CPU IP,轉而支持ARM 的Neoverse 內核。
從DPU 用例來看,這款Armv9 CPU 也支持SVE2,其中包含了有利於數據處理和機器學習功能的重要指令,這點較英偉達BlueField3 DPU 設計具有很大的優勢(後者仍停留在Armv8.2 + 的Cortex-A78 內核)。
Marvel還為N2配備了完整的緩存選項,包括6 4K B L1I和L1D緩存,以及完整的1MB L2緩存。不過在網狀網絡解決方案上,Marvell還是選擇了為該SoC集成自家的設計。
這部分的規格相當高,網狀網絡中提供了256-bit 數據路徑,輔以2MB 的L3 共享緩存,並且能夠隨著核心數量的增加而加大。
在交換集成和網絡吞吐量方面,Marvell 結合了1 Tbps 交換與多達16 路50G MAC 整合到了一起,儘管實際產品SKU 還是會針對特定場景而有所區分。
AnandTech 指出,OCTEON 10 系列涵蓋了廣泛的應用,從4G / 5G RAN 數字/ 中央單元、到前傳網關vRAN 卸載處理器等。
在雲和數據中心用例上,這些解決方案可在計算與網絡吞吐量性能方面,提供廣泛的多功能性。對於企業而言,OCTEON 10 系列亦可提供深度集成的數據包處理和安全加速特性。
首個OCTEON 10 產品將基於CN106XX 設計,在PCIe 5.0 外形尺寸上提供了24 個N2 內核+ 雙路100GbE QSFP56 端口,
目前CN106XX 已經完成流片,預計將於2021 下半年出樣,且有望在4 季度上市。規格方面,Marvell 對OCTEON 10 系列的各種設計進行了細分。
比如本文介紹的DDR5 控制器特指40-bit 通道(含8-bit ECC),輔以SPECint2006 基準測試的性能參考數據。
此外Marvell 準備了另外三款OCTEON 10 SKU,包括僅配備8 個N2 內核、TDP 低至10-25W 的入門級CN103XX,兩款改進網絡連接的高端款CN106XXS,以及多達32 個N2 內核、運算能力和網絡連接吞吐量都最高的旗艦級DPU400 。
好消息是,即便是規格最強的產品,其熱設計功耗也只有60W,遠低於當前一代CN98XX Octeon TX2 旗艦SKU 的80-120W。不過這些產品尚未流片,預計出樣時間為2022 年。
Marvell 總結道,該公司在DPU 出貨量方面一直處於行業領先地位,且在所有大型數據中心都有廣泛的部署。隨著全新一代OCTEON 10 系列產品的到來,其將在性能和效率方面擁有更顯著的競爭優勢。