10年來最重要創新ARM發布AMRv9指令集:IPC性能大漲30%
今天凌晨,ARM正式推出了ARMv9指令集,官方稱之為10年來最重要的創新,將是未來3000億ARM芯片的基礎。包括目前性能最強的Cortex-X1/A78在內,現在所用的ARM芯片還是基於ARMv8.x指令集的,2011年首次推出,主要特點是增加了64位指令集支持。
相比之下,ARMv9的升級看點就多了,過去10年計算架構有了太多變化,ARM處理器也不止是移動/嵌入式專用了,已經擴展到了PC、HPC高性能計算、深度學習等等新市場。
ARMv9在兼容ARMv8的基礎上,提升了安全性、增強了矢量計算、機器學習及數字信號處理,同時繼續提升處理器性能。
首先來說說性能上的變化,以智能手機等移動平台使用的Cortex-X/A系列為例,X1/A78這一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架構及Makalu架構會保持30%以上的IPC性能提升。
IPC提升與頻率無關,如果再考慮到未來工藝帶來的頻率增加,那麼CPU性能有望提升40%以上。
除了CPU性能,ARMv9還非常重視整體的性能提升,包括降低內存延遲(從150ns降至90ns)、頻率提升(從2.6GHz到3.3GHz)內存帶寬(從20GB/s到60GB/s)、緩存等。
ARMv9這次與性能有關的一個重要升級是SVE2指令集,SVE最早是ARM與富士通合作的浮點性能擴展,日本最強也是TOP500最強超算富嶽就使用了SVE指令集,現在推出的是第二代SVE浮點指令了。
相比SVE的128位矢量,SVE2可以支持多倍128位運算,最多2048位,因此SVE2可以增強ML機器學習、DSP信號處理能力,提升了未來5G、虛擬現實、增強現實以及CPU本地運行ML的性能,同時ARM未來還會繼續提升AI人工智能性能。
除了CPU之外,這次還簡單提到了未來的Mali GPU,ARM會增加更多高級功能,比如VRS可變幀率渲染、RT光線追踪及其他高級渲染技術等。
在ARMv9中,最重要的一項挑戰其實是數據安全,這一次ARM推出了全新的CCA機密計算體系架構,基於之前的TrustZone安全技術,但引入了動態域技術,它對操作系統及管理程序來說是完全不透明的,不會被系統或者軟件提權攻擊,而且依然可以接受管理及調度。
總之,ARM今天公佈的ARMv9指令集極具創新,是未來10年3000多億ARM芯片的基礎,不過現在具體的細節還很少,只是一個初步的路線圖,今年夏天還會公佈更多詳細內容。
至於ARMv9處理器的商業化,預計會在2022年早些時候進入市場。