詳解DirectX 12 Ultimate – 一次面向未來應用的大升級
微軟於昨晚正式宣布推出DirectX 12的最新升級版——DirectX 12 Ultimate,這可以說是DirectX 12從2015年正式上線以來最為重大的一次更新,它加入了許多新的特性,實際上其中的部分特性已經在去年十月份已經預告過了。
原本它應該會作為Direct3D 12 Feature Levels 12_2出現的,不過這次微軟改名部上線了,給新版本DirectX 12加了個“Ultimate”的後綴,那今後比DirectX 12 Ultimate更強的新版本會叫什麼呢?
以後支持DX12 Ultimate的產品在包裝盒上可能會增加這個Logo
好了話說回來,官方在博文中給出了有關於新特性的一些詳細內容,本文就嘗試解讀一番。
首先DirectX 12 Ultimate中新增的特性主要有四大塊,分別是DirectX Raytracing 1.1、可變速率渲染、Mesh渲染器和採樣器反饋(Sampler Feedback)。
DirectX Raytracing 1.1
DirectX Raytracing(DXR)是微軟在2018年為DirectX 12引入的新特性,讓它支持實時光線追踪處理。1.0版本的DXR在軟件特性上比較基礎,可以說它是圍繞著Turing架構的硬件實現而設計的,當時也沒有從軟件開發角度去考慮如何實現光追。而1.1版本擴展了DirectX 12在光線追踪方面的軟件特性,讓它的效率更高,同時對開發者也更友好。主要有三點:
允許GPU直接調用光追
跑在GPU上面的著色器在1.1版本中可以直接調用光線追踪,而無需折返CPU來調用。這項功能對於自適應光線追踪場景非常有用,尤其是在基於著色器實現的剔除、排序、分類和細化等場景中。基本上今後的光線追踪工作可以在GPU上面準備並立即生成。
按需加載光線追踪著色器
當玩家在遊戲世界中移動、新的物件變為可見的過程中,流式引擎可以根據此時的畫面需求來加載新的光線追踪著色器,提高處理過程的效率。
內聯光線追踪
內聯光線追踪(Inline raytracing)是目前基於動態著色器的光線追踪的一種替代形式,你可以將其理解為一種簡化的光線追踪。開發者在內聯光線追踪過程中將有更大的控制權,並且可以在任意的著色階段調用它,包括計算著色和像素著色階段。它與傳統基於動態著色器的光線追踪可以混合使用,對於簡單的場景,內聯光線追踪將會提供更好的性能表現,而在復雜場景中,基於動態著色器的光線追踪將會提供更好的運行效果。
可變速率著色
可變速率渲染(Variable Rate Shading)是一項由NVIDIA在其Turing GPU上率先引入的加速著色特性,具體介紹可以看我們的課堂文章:《超能課堂(212):VRS可變速率著色為什麼可以提高幀數?》,這邊就簡單講一下它的原理,而不再贅述細節了。
簡單來說,VRS的原理是通過改變單次像素著色器操作所處理的像素數量,來改變屏幕不同區域的著色質量。簡單來說,它可以改變同個畫面中不同部分的渲染精細度,它的用處是提高畫面幀數。
在不開啟VRS的情況,也就是正常情況下,一幀畫面的所有像素都是獨立著色的;而開啟VRS之後,原本獨立的像素被分成了一個個像素塊,它們會共享著色結果,此時GPU會根據程序員設定的重要性分級為所有像素塊分配不同的著色精細度。拿上面的圖片為例,車輛和遠景部分的像素仍然是獨立著色的,但快速變動的道路和路邊的像素塊就是區塊共同著色的,此時由於顯卡的計算資源得到了節約,所以遊戲的幀數會有所提高。
在NVIDIA以外,Intel已經在Ice Lake處理器中的第11代核顯中加入了針對VRS的支持,而AMD方面則暫時沒有相關支持,不過他們也已經宣布將會在RDNA 2架構中加入相關支持。
Mesh著色器:下一代幾何處理管線的基礎
在過去的二十年中,傳統的幾何圖形處理管線已經增加了好幾個階段了,不過它的核心理念仍然基於傳統的光柵化預著色方法的,放在今天已經過於復雜,並且拖累處理效率。硬件和軟件開發者都希望改變這一現狀,於是,DirectX 12引入了Mesh著色器,它為開發者提供了前所未有的可編程能力。
原本的管線中,GPU硬件的並行能力被隱藏,或者說是被自動化了,硬件會幫助打包操作然後並行執行它,這很高效,但也存在問題——靈活性不夠。
Mesh著色器就完全改變了這一過程,它不再是針對單一頂點或圖元的單一函數,而是工作在整個計算線程組中。在某一階段中,Mesh著色器的每個線程都是針對一個頂點,而在另外一個階段,每個線程針對著一個圖元。整個線程組的內存是共享的,訪問靈活度很高,同時開發人員對硬件的控制權也更大,甚至還能啟發新的技術,節約內存使用量和內存帶寬。
與Mesh著色器一同出現的還有一個可選的放大著色器(Amplification Shader)階段,它運行在Mesh著色器之前,計算得到需要多少個Mesh著色器,並啟動他們。
採樣器反饋
最後一個大特性就是採樣器反饋(Sampler Feedback),先說效果:更好的視覺質量、更短的加載時間和更少的卡頓。它的核心思想實際上就是讓程序只加載必要的紋理,把資源交給更有需要的地方。
採樣器反饋是允許遊戲引擎去跟踪紋理採樣器的使用方式,讓後者向引擎提供反饋,方法是生成“反饋圖(Feedback Map)”,它會記錄不同紋理區域的不同駐留等級,然後程序可以根據這些反饋信息來做決策——包括該如何使用紋理採樣器和要在顯存中保留哪些資源等。這比原先的流程更為精確,可以更好地分配計算資源。簡單來說它的實際效果就是用更少的顯存渲染更大、更詳細的紋理。
另外,採樣器反饋還允許了一項新技術——紋理空間著色。它可以在不柵格化對象的情況下進行對象著色,其中心目的就是緩存和重用著色結果,減少GPU的計算量。
總結:面向新圖形架構和下世代主機
在微軟推出DirectX 12 Ultimate之後,NVIDIA和AMD就迅速地宣布已經/將要支持它,實際上,DirectX 12 Ultimate的絕大部分新特性可以說是基於Turing架構來的,NVIDIA在設計Turing架構時可能預留了相當部分的新特性是沒有公開的。而AMD方面在目前只能說是一個跟進者,要用上新特性,首先要等到年底的RDNA 2架構。
DirectX 12 Ultimate的這些特性很明顯有兩個共通的目標,一是提高開發者對硬件的控制力,二是提高總體計算效率。這也是為下世代主機—— Xbox Series X和傳說中的Xbox Series S所準備的,很難說我們要等多長時間才能看到這些特性被應用到實際遊戲中去——至少今年是看不到的,需要等引擎開發商、遊戲開發者對新世代主機做適配或者做專門性的開發後,我們才能在PC遊戲中也看到這些技術的運用。
以上就是DirectX 12 Ultimate的詳細解讀,由於我不是業內人員,對這些特性的理解也只是點到為止,難免存在認知錯誤,敬請讀者指正。