Intel Xe HPG銳炫遊戲顯卡架構公開:台積電6nm、驅動完全重寫
Intel日前宣佈基於Xe HPG架構的高性能獨立顯卡命名為”銳炫”(Intel Arc),首款產品Alchemist(DG2)將在明年初發佈。 今天的架構日活動上,Intel公佈了Xe HPG架構的不少細節。 可以說,這一次,Intel是很認真的,尤其是經過Xe LP低功耗架構的試水之後,Xe HPG高性能架構將真正向NVIDIA、AMD發起挑戰!
Intel GPU多年來的基本模組一直都是”執行單元”(EU),這次變成了全新的”Xe核心”(Xe Core),包含向量和矩陣(張量)ALU單元、零級和一級緩存、載入存儲單元等等。
大致看來,Intel Xe核心的組織方式有點像NVIDIA SM,只是少了紋理單元,當然內部結構肯定是迥異的。
Xe核心內有16個向量單元,或者叫向量引擎,每個每時鐘週期可處理256位,又可細分為8個FP32 ALU單元,因此每個Xe核心每時鐘週期顆處理器128個FP32操作。
同時還有16個矩陣數學單元,或者叫矩陣引擎(XMX),處理矩陣、張量操作,每個每時鐘週期可處理1024位,可以是64個FP16操作,也可以是128個INT8操作。
Xe核心的上一層級是”渲染切片”(Render Slice),專為DX12 Ultimate設計,每個包含4個Xe核心、4個光追單元、4個紋理採樣器、幾何前端、光柵前端、2個圖元後端。
值得一提的是,光追部分支援DirectX光追(DXR)、Vulkan光追。
Alchemist DG2 GPU包含最多8個渲染切片,共用大容量二級緩存。
不過架構圖上並未畫出PCIe控制器、多媒體引擎、顯示控制器等固定功能單元,但我們知道,它會首發支援DisplayPort 2.0。
這顆GPU將交給台積電代工,採用後者的N6 6nm工藝,也就是7nm的優化升級版。
台積電對此也是相當興奮,稱將為Intel GPU提供優化的性能、密度、能效平衡。
Intel宣稱,通過架構、邏輯設計、電路設計、製程工藝技術、軟體的全方位優化,相比於Xe LP微架構,Xe HPG微架構可以實現1.5倍的頻率提升、1.5倍的能效提升。
照此推算,Alchemist顯卡的頻率應該在2GHz左右,FP32算力大約16.4TFlops,是之前DG1低功耗獨顯的幾乎8倍。
當然,軟體開發是釋放硬體設計潛力的關鍵,這方面Intel也是傾盡全力,並公佈了最新的進展。
目前,Intel正與開發人員密切合作,進行Xe微架構的設計,力求與行業標準保持一致。
驅動程式也在統一的代碼庫中涵蓋集成、獨立顯卡,Intel稱第一款高性能遊戲顯卡將性能和品質放在首位。
同時,Intel已經完成了內核顯卡驅動程式元件的重新架構,特別是記憶體管理器、編譯器,號稱計算密集型遊戲的輸送量平均提高了15%,最多可達80%,而遊戲載入時間縮短了25%。
Alchemist只是Intel高性能顯卡的第一步,接下來還會有基於第二代、第三代Xe HPG微架構的Battlemage、Celestial,然後將是全新下一代Xe架構的Druid。