英特爾銳炫顯卡崛起DirectX 11遊戲體驗脫胎換骨
自去年英特爾發布銳炫顯卡以來,尤其是在進入到今年之後,英特爾加快了銳炫顯卡驅動的更新頻次,進而使得銳炫顯卡在DX9、DX11遊戲方面取得了顯著進步。同時在DX12遊戲方面,得益於架構優勢,銳炫顯卡本身就有著良好的性能支持。
DX11、DX9遊戲體驗大幅提升
根據英特爾最新披露的數據來看,銳炫A750 8GB限量版顯卡在最新驅動加持,以及搭配英特爾13代酷睿i5-13400F處理器的情況下,相對於首發時的驅動版本,1080P分辨率下DX11遊戲性能已經足足提升了19%,99%低幀流暢度提升了20%。
了解硬件的朋友都知道,僅憑驅動優化就取得如此大幅度的提升並不容易,但是英特爾銳炫做到了。
截至目前為止,英特爾在今年已經推出了多達十數個個大大小小的銳炫顯卡驅動,總計已經推出了近30個驅動版本的更新。
今年一季度,英特爾發布的針對DX9遊戲大幅提升的驅動,促使平均性能提升約為43%,與此同時,銳炫A750顯卡降價至249美元,整體性價比大幅提升。
以《CS:GO》、《英雄聯盟》等遊戲為例,在首版驅動3490和一季度發布的4086驅動之間,DX9遊戲體驗的提升是極大的,最高達到了77%,最低也有10 %的平均幀率提升,這使得英特爾銳炫顯卡在DX9遊戲上的不足得到彌補。
今年二季度,英特爾進一步深入研究了CPU與GPU的平衡問題,通過大量數據統計,表明銳炫A750合適搭配的選擇是酷睿i5,隨後提供了大量優惠,加速了銳炫的推廣進程。
在新發售遊戲優化方面,目前英特爾為57款新遊戲提供了Day 0 Gameon的首日優化支持,這意味著當一款新的大型遊戲發佈時,英特爾需要完成所有的優化工作,並準備好所有的驅動,進而為玩家帶來更好體驗。
此外,Intel XeSS技術也在加快拓展遊戲支持,目前原生支持XeSS技術的遊戲已經超過70款。可能也只有英特爾這樣擁有強大生態能力的公司,才能在短短一年不到的時間里達成如此多里程碑的吧。
CPU與GPU的平衡關係
在一系列優化驗證過程中可以看到,英特爾提供的數據都是在銳炫A750與英特爾酷睿i5處理器基礎上進行的測試,因為數據顯示酷睿i5處理器是銳炫A750的最佳平衡選擇,那麼此時就會有一個問題產生:如果使用酷睿i9處理器去做相同測試會發生什麼呢?
從下圖可以看到,對於酷睿i9處理器,最新驅動與初版驅動之間的性能提昇在9%到30%之間,雖然也是相當大的提升,但比起酷睿i5最高77%的提升顯然是要稍微遜色一些。
總體來說,酷睿i5平均性能提昇在19%~20%,而酷睿i9約為12%,當看到這組數據時,是不是有悖於我們慣有的認知呢?性能越強的處理器不是應該提升更明顯嗎?
其實並非如此。當你使用集成顯卡的時候,CPU因為負載更大,所以CPU性能提升往往有著更高的收益比;而當GPU性能足夠強時,很多時候性能受限就轉移到了CPU上,因此驅動程序需要重新架構,以減少每幀所需的CPU工作量,此時CPU的提升收益就完全不如GPU提升收益來的大了。
我們都知道,遊戲每一個畫面幀都需要一定的渲染時間,也就是Frametime,幀生成時間。下圖是英特爾官方給出的渲染流程示意圖,簡單來說就是遊戲每一幀開始時會執行一系列邏輯,隨後進行物理計算,進行命中檢測,將目標移動到新的位置,可能會繪製新的幾何圖形等,之後會進入渲染過程。
在計算完遊戲狀態之後,它會將所有的遊戲狀態傳遞給一個渲染器,然後渲染器將從遊戲狀態轉換為DirectX調用並進行傳遞,之後會執行名為Present”的操作,它是一個DX命令,當被調用時,就意味著已經將所有圖形信息都發送給了DirectX,它現在可以渲染一幀,CPU隨之進入等待狀態,等待“Present”返回之後,進入下一個循環,也就是開始等待渲染新的一幀。
什麼是GPU Busy?
為了搞清楚從一幀的“Present”到下一個幀的“Present”之間的時間間隔,也為了搞清楚CPU與GPU之間在這些階段的平衡關係,英特爾引入了一個新的衡量指標:GPU Busy。
通過GPU Busy指標,用戶可以了解到GPU使用多少時間進行實際渲染,多少時間是空閒等待狀態。同時可以了解遊戲運行時,CPU與GPU工作是否處於平衡狀態,是彼此之間高效協同工作,還是互相閒置互扯後腿。
因此,GPU Busy可以幫助玩家更加清晰直觀地了解到自己的CPU與GPU是否匹配,二者時間是否存在一些瓶頸,同時還能夠分析出遊戲分辨率、畫質設定是否合適,以便做出更有對策性地調整。
英特爾院士Tom Petersen表示,“GPUBusy會因遊戲而異。在設置中,一般來說,在運行更多的GPU密集型活動時,GPU Busy的程度會更高,當較少時,它會更低,並且大多數情況下可以很容易通過更改分辨率體現出來。”
比如以1080P分辨率、Ultra畫質下的《守望先鋒2》測試為例,銳炫A750顯卡在搭配酷睿i5處理器時,在首發3490驅動版本下以及在後續4571版本下,GPU Busy(黃色)與幀生成時間(藍色)之間的狀態有著非常顯著的差異。
在使用4571驅動時,GPU Busy與幀生成時間幾乎處於完全同步的狀態,這意味著CPU與GPU在絕大部分時間都能夠高效協同工作,不會出現明顯的空閒等待期,因此在效率上獲得顯著提升。
GPU Busy這項指標也能夠衡量出遊戲在不同畫質時的GPU Busy與幀生成時間之間的狀態。如下面兩張圖所示,在《反恐精英2》這款遊戲中,同樣配置、同為4571驅動的情況下,1080P分辨率低畫質和Ultra畫質時的曲線狀態差異非常明顯。
如果作為玩家看到這樣的GPU Busy指標狀態,那麼就會明白,這款遊戲在當前配置下最合適的畫質設定就是“Ultra”,而非“Low”。
可見,在引入GPU Busy指標之後,如果玩家特別在於CPU與GPU的工作效率,亦或者說想要獲得最佳遊戲體驗,就能夠更加針對性地去選擇硬件搭配和遊戲設定了。
通過PresentMon Beta更好地了解GPU Busy
那麼我們如何才能夠測量出自己電腦的GPU Busy指標呢?為此,英特爾推出了PresentMon Beta測試工具。它是為終端用戶和媒體提供的工具,可以使GPU Busy與幀生成時間之間的平衡關係變得可視化。它同時兼容N卡和A卡,支持DirectX11、12、OpenGL、Vulkan等API。
如下圖所示,PresentMon提供了全新的疊加視圖功能,在遊戲時可以實時監測各項性能數據,如GPU Busy指標、遊戲實時幀率、GPU佔用率、溫度等信息,還能夠監測99%低幀狀態等。
PresentMon可由用戶進行界面顯示參數的自定義,調整顯示效果等等,它包含了大約30種不同的參數可以監控,用戶可以將其設置為數字文本或圖形圖表模式,同時它也支持直方圖,通過不同的UI形式讓用戶更加了解自己電腦遊戲時的狀態。
其實在筆者看來,如果英特爾能夠把PresentMon集成到Arc Control控制面板裡會更加方便。但根據Tom Petersen的介紹來看,PresentMon其實本身也是一個軟件的集合,因此它涵蓋了一些底層SDK,以便為高級別的軟件提供服務。
隨著後續版本更新,Arc Control可能會逐步開始利用PresentMon服務,但目前還無法實現。因此現階段英特爾首先是將可PresentMon的各項功能加以完善,讓它能更加獨立地運行。此外考慮到PresentMon可以兼容N卡、A卡,因此現階段作為獨立軟件去使用會更符合自身定位。
結語
自去年10月發布銳炫GPU以來,英特爾在短時間內大幅優化了DX9遊戲體驗,並且重新設計了DX11驅動,帶來了高達19%左右的遊戲性能提升以及大約20%的99百分位提升。
此外,英特爾全新引入GPU Busy指標去衡量遊戲過程中CPU與GPU之間的平衡關係,並且可以幫助用戶通過更改遊戲畫質設定、分辨率設定等來提升硬件效率。同時,英特爾推出全新的Intel PresentMon Beta測試工具,終端用戶可以自由下載,並通過它來監測電腦狀態,了解自己電腦的GPU Busy指標。