GDC 2022:英特爾詳解ARC Alchemist GPU的XeSS與光追性能優勢
GDC 2022 大會期間,英特爾舉辦了多場會議,其中詳細介紹了ARC Alchemist GPU 支持的各項功能,比如XeSS 和光線追踪,及其如何較競爭對手帶來更好的性能與圖像質量。儘管這不是我們首次談論,但該公司確實分享了一些新的細節和性能指標。首先聊聊XeSS,作為藍廠的超級採樣技術,其利用了機器學習將低分辨率幀重構為高分辨率,且運行渲染開銷僅為4K 等更高分辨率的一小部分。
通過WCCFTech _
XeSS 的核心原理是通過ARC Alchemist GPU 的Xe-Cores 上集成的XMX AI 加速硬件,來充分發揮機器學習的效用。
英特爾聲稱XeSS 優於Temporal Upscaling 2 方案
該方案與DirectX 12 完全兼容,且適用於英特爾ARC SIMD 架構上運行的基於矢量著色語言的神經網絡(NN)。
與原始4K分辨率相比,使用XMX 的XeSS 4K 渲染場景、開銷不到前者的一半。該技術還符合DP4a 標準,這意味著它能夠在沒有XMX 等AI 或ML 加速引擎的GPU 上運行,輔以相近的性能和圖像質量。
與TAAU 等升級方案相比,XeSS 以最少的偽影(如閃光)來消除各種重影,帶有內置的銳化引擎以取代TAA 。此外與超級採樣或空間升級方案相比,XeSS 能夠在不影響質量的情況下實現更高的縮放比例。
英特爾還分享了一個全新的XeSS Rens 演示,選擇了在固定頻率的英特爾ARC Alchemist GPU 上運行光追/ 五檔不同的XeSS 預設分辨率(超性能、性能、平衡、質量、超質量)。
可知在Ultra 性能模式下,其能夠帶來2.53 倍的性能提升,Ultra Quality 更是能夠在4K 分辨率下實現較原生高27% 的性能提升。
英特爾繼續深入自家光追方案,及其如何較英偉達/ AMD的競爭方案更具優勢。比如繞過針對命中著色器、紋理的SIMD 發散,並使用一組硬件分類來處理光線和線程,以最大限度地延長每個通道的正常運行時間。
如此一來,英特爾ARC Alchemist GPU 的光追方案,本質上就更貼近於自動加速硬件。在一張通過預生產顯卡跑出的性能指標PPT 中,我們看到GPU 在RayQuery(relative)vs DXR1.0 對比中具有0.775 的性能表現。
英特爾還解釋了出現這種情況的原因,以及為何會在自家GPU 上看到這種性能下降。之後該公司討論瞭如何在遊戲引擎中利用12 代Alder Lake CPU 中引入的混合式核心架構設計。
據悉,Intel 與IO Interactive 一直在CPU / GPU 優化上努力,以便開發者能夠充分利用AI 加速、角色動畫、物理、碰撞、音頻處理等後台任務,在適當情況下積極調用單線程性能更具優勢的P 核。
以《Hitman 3:Dartmoor》遊戲為例,英特爾展示了在啟用高性能P 核/ 節能E 核的情況下的對比表現。可知12 代Alder Lake CPU 的混合架構具有+4% 的平均幀速率優勢,九成情況下可將FPS 提升12%、一成情況下降低了2% 。
不過最大的改進,還是在其物理框架內—— 等待時間減少了55%( 90% @ 1.7 ms),整體幀時間減少了25% —— 由於需要在渲染線程上等待,較快的幀確實會減慢一點。
當然,上述只是Intel 官方給出的初步細節。至於更多內容,還請耐心等待3 月29 日正式推出首批ARC Alchemist GPU 後再開展實戰檢驗。