英特爾開始推出Habana Labs Gaudi2 Linux驅動程序代碼
在上月的VISION 會議上,英特爾宣布了Gaudi2 硬件。作為該公司旗下Habana Labs 用於訓練和推力的第二代加速器,它也同步迎來了開源Linux 內核驅動/ 用戶空間軟件堆棧更新。英特爾宣稱Gaudi2 的AI 訓練性能是英偉達A100 競品方案的兩倍,且芯片製造工藝也從初代16nm 升級到了7nm 。
(通過Phoronix)
此外Gaudi2 迎來了3 倍的TPC 改進,32GB HBM2 高帶寬內存增加到了96GB HBM2e、SRAM 緩存也翻倍到了48MB,輔以24×100 GbE 連接,但熱設計功耗(TDP)也從350W 提升到了600W 。
在發布一個多月後,Habana Labs Gaudi2 的開源驅動程序工作也在有條不紊地推進中。而當前的Gaudi2 支持,正好建立在現有的Gaudi 和Goya 加速器內核驅動程序(habanalabs)的基礎上。
Habana.ai 白皮書揭示了與Gaudi2 架構相關的更多信息
從驅動角度來看,Gaudi2 與初代非常接近,整體架構也是一個樣。啟用Gaudi2 大約需要15.8 萬行新內核代碼,但其中大部分屬於“頭文件”(AMD GPU 內核驅動程序也有大量頭文件)。
截至目前,新的頭文件主要代表了該主線驅動程序啟用Gaudi2 支持所需的大部分代碼變動。除了內核驅動工作,英特爾今日還發布了TPC_LLVM 1.1(針對Habana Labs 加速器的新版開源編譯器)。
TPC_LLVM 1.1 添加了對Gaudi2 及新的Greco ASIC 編譯器的支持
與此同時,英特爾也在努力更新SynapseAI Core for Gaudi2 開源組件,新補丁系列用於新的Gaudi2 內核驅動程序代碼。
鑑於新版是從相同的Gaudi 架構演變而來,預計後續的代碼審核工作也會相當順利,那樣我們就有望在v5.20 內核週期內盡快添加對Intel Gaudi2 的支持。
最後,英特爾還在VISION 2022 會議上宣布了從Goya 升級而來、針對深度學習應用而作出效率優化的Greco 加速卡。