Arm全面進化:CPU超越酷睿i7、GPU光追性能猛增3倍
作為移動芯片領域的王者,Arm每年都會帶來新的CPU、GPU、互連技術方案,近日就奉上了全新的Arm TCS22,也就是2022年全面計算解決方案,包括一系列IP組合。CPU方面是全新旗艦超大核心Cortex-X3、大核心Cortex-A715,以及升級版小核心Cortex-A510(名字沒變)。
GPU方面是首次支持硬件光線追踪的旗艦級Immotalis-G715、高端的Mali-G715、高端的Mali-G615。
互連方面則是升級版的DSU-110。
接下來,我們就分別看看都有哪些變化。
【CPU:超大核性能提升25%、三種核心組合更靈活】
2021年3月底,Arm正式發布了全新的Armv9指令集,號稱10年最重要的創新、面向未來10年移動計算的基石。
Armv9重點增強矢量計算(SEV2指令集)、機器學習、數字信號處理,強化安全性,並繼續提升性能,號稱IPC性能未來兩代提升會超過30%。
當然,它完全向下兼容Armv8。
Armv9指令集的Cortex-X2超大核心已經在驍龍8/驍龍8+、天璣9000/天璣9000+等旗艦移動處理器中得到應用,這次發布的是新一代Cortex-X3。
Cortex-X3在架構設計上的變化相當深入、廣泛,比如解碼器每週期指令從5個增加到6個,亂序執行窗口從288個增加到320個, ALU整數算數單元從4個增加到6個,二級緩存容量從512KB翻番到1MB,並且不再支持32位指令集。
性能方面,3.3GHz頻率、1MB二級緩存、8MB三級緩存的配置下,與基於Cortex-X2的安卓旗艦處理器對比,提升最多25%。
3.6GHz頻率、1MB二級緩存、16MB三級緩存的配置下,與主流筆記本處理器(Intel i7-1260p)相比,單核性能高出最多34%。
Cortex-A715注重性能與能效的平衡,對比去年的Cortex-A710,在同等性能下能效提升最多20%,而在同等功耗下性能提升最多5%。
同時,它已經達到了上上代超大核Cortex-X1的性能水準。
對了,A710也僅支持64位指令集。
Cortex-A510名字沒變,性能也沒變,不過能效提升了5%,應該是與更新製造工藝結合的效果。
同時,它也是唯一保留32位指令集支持的核心。如果一款App還沒有升級到64位,今後只能依賴小核心執行,效率必然大打折扣。
Arm也是意在通過此舉推動行業向64位加速轉型。
另外,DSU-110互連單元也更加強大靈活,支持核心數量增加50%,比如Cortex-X3可以最多12核心、16MB三級緩存,還支持更多指令集。
big.LITTLE大小核的組合也更加靈活、豐富,同樣1+3+4,X3+A715+A510的組合比去年的X2+A710+A510性能可提升12%。
1+4+4則可比1+3+4性能提升最多21%,2+2+4可提升最多23%,還首次加入了8+4+0這樣的組合,面向中高端筆記本,性能高出足足120%。
總體而言,Cortex CPU今年的升級比較中規中矩。X3、A715都是預料之中的對位升級,A510本身幾乎毫無變化。
但是,結合新的DSU-10互連單元,三種核心的配置更加靈活多變,可滿足不同設備、應用場景的不同需求,包括在筆記本領域繼續競爭Intel、AMD x86雙雄。
【GPU:首次迎來硬件光追名字都變了】
Arm Mali GPU憑藉與Cortex CPU的整合優化、持續不斷的迭代升級,已經成為移動行業的絕對主流,出貨量全球領先,累計已超80億。
這一次,Arm GPU迎來了一次超級變臉,旗艦型號放棄了Mali的傳統名字,改成了全新的“Immortalis”,首款型號“Immortalis-G715”。
之所以改名,首要原因就是第一次支持基於硬件的光線追踪,和NVIDIA、AMD、Intel的高性能顯卡一樣進入了光追時代。
當然,Arm GPU不是第一個支持光追的移動端產品,Imagination此前已經做到,但是兩家的影響力不可同日而語,Imagination的光追方案時至今日仍然沒有落地。
其實,去年的Mali-G710已經支持軟件光追,聯發科天璣9000就開啟了這一功能,並用在了OPPO Find X5 Pro天璣版手機中,今年則升級為硬件光追。
當然,光線追踪非常消耗硬件和軟件資源,一般也會大大增加功耗,不過Arm宣稱,Immortalis-G715的光追單元只佔用了大約4%的著色器核心面積,而且功耗非常低,就帶來了超過3倍的性能提升(對比軟件光追)。
以下是Arm官方給出的光追效果對比圖,右半部分為開啟光追,可以看到豐富、清晰的反射、陰影,與非光追不可同日而語。
當然,無論是性能、功耗、效果,都還有待實際考驗。
VRS可變刷新率也成了標配,同樣追上了NVIDIA、AMD、Intel的腳步。
該技術隸屬於DX12範疇,簡單地說可在單個幀畫面內改變著色速率,選擇性地降低畫面部分區域的細節水平(被遮擋/畫面邊緣等),從而在幾乎不影響畫質的情況下,提升圖形性能。
Arm展示了VRS在騰訊《王者榮耀》中的效果,原畫面和VRS畫面幾乎看不出任何區別,而在性能上,官方號稱可將幀率提升最多達40%。
回到常規層面,Immotalis-G715的提升也非常可觀,官方號稱對比上代Mali-G710同等功耗下性能提升最多15%,機器學習性能直接翻番,而在同等性能下能效可提升最多15%。
它可以配置10-16個核心。
另外,Arm對執行引擎也做了全方位增強,主要有三個方面:
一是重新設計轉換模塊,大大縮小占用面積。
二是升級乘積累加運算(FMA),模塊數量翻番,進一步提升性能和能效。
三是支持矩陣乘法指令(Matrix Multiply),可提升計算攝影、圖像增強的效率,這也是機器學習性能翻倍的主要來源。
其他方面,指令流前端(Command Stream Frontend)、層次細節(LOD)、固定率壓縮(AFRC)等技術都得到了升級。
同時,Arm 也發布了高端的Mali-G715 GPU(是的編號一樣),沒有光追,能效提升15%,可配置7-9個核心。
還有高端的Mali-G615,可配置最多6個核心。
它們倆也都支持VRS可變刷新率,這已經是Arm GPU的標配,同時也升級了執行引擎。
總體而言,Arm GPU今年的變化比較極端,新引入的頂級核心Immortalis-G715整體煥然一新,性能提昇明顯,尤其是將開啟手游的光追新時代。
Mali-G715、G615的亮點則在於普及了VRS。
【未來:一年一變每年提升兩位數性能】
有趣的是,Arm這次很大方地公佈了未來兩年的路線圖。
明年的TCS23,超大核CPU升級為CXC23(預計命名Cortex-X4),大核、小核分別升級為Hunter、Hayes,DSU互聯單元升級為Hayden,旗艦GPU則升級為Titan。
後年的TCS24,超大核CPU再次升級為CXC24(預計命名Cortex-X5),大核升級為Chaberton,小核則維持不變還是Hayes,旗艦GPU則繼續升級為Krake。
另外,沿用多代的CoreLink CI-700一致性互連技術、CoreLink NI-700片上網絡互連技術,也終將迎來更新,代號Tower。
希望Arm未來能在能效、擴展性、平台安全性方面齊頭並進。