ARM發布Cortex M55內核與Ethos U55 microNPU
近日,ARM不僅宣布了最新的Cortex-M系列內核(最新的Cortex M55),還引入了Ethos U55 microNPU等改進。ARM希望通過新的IP,於將來幾年內為數十億低功耗嵌入式設備提昇機器學習和推理能力,擴展自家產品組合,以滿足新的用例需求。
(題圖via AnandTech)
過去幾年,機器學習技術的應用已變得相當普及,可見其在廣泛的行業和各種系統中。ARM 認為終端AI 市場會在未來幾年中迎來爆炸性增長,新IP 就是為此做準備。
首先介紹下Cortex-M55,它是與M33 聯繫更加緊密的新一代IP,引入了體系架構上的新改進,能夠在機器學習和矢量指令方面實現較大的性能和靈活性改進。
Ethos-U55 是專用的microNPU 推理加速器,可與Cortex-M 系列CPU 結合使用,帶來專門面向於NPU 的性能與能效提升。
與Cortex-M 系列內核一樣,Ethos-U55 的空間佔用也比較少。至於Cortex-M55,則是首款具有Helium / 定制指令能力的CPU 內核。
Helium 特指M-Profile Vector Extension(簡稱MVE),屬於M 系列CPU 中的新矢量擴展和專用矢量執行單元,使之成為該範圍內首款具有單指令多數據流(SIMD)功能的產品。
新增功能使得新內核的DSP 性能提升了5 倍,結合針對機器學習工作負載的優化指令和MVE,整體表現可提高至15 倍。
整體微架構方面,新IP 算是繼承了M33 和µarch 。在頻率提升的加持下,它將標量工作負載的性能提升了大約20%,具體取決於供應商的配置。
新內核的設計重點,同樣體現在帶寬上。其啟用了需要帶寬的新MVE 和機器學習工作負載,因此對內存子系統進行了改進,比如4×32-bit 接口與緊密耦合內存(TCM)。
儘管ARM 進入NPU 領域的時間相對較晚,但新推出的Ethos-U55 microNPU,還是較嵌入式市場有著獨特的意義。與移動SoC 上更大的Ethos-N 系列相比,它的面積和功耗要低得多。
Ethos-U55 是一種小型NPU,可從32 路擴展到256 MAC、且需要與Cortex-M 系列NPU 耦合。
ARM 未提及微體系架構的主要細節,但可知它是一種非常精簡的設計,注重的是面積和能源效率、具有較小的內存佔用量,其中包含我們在N 系列產品中見到的一些特性,如Weight Decompression 。
即便如此,它與N 系列在功能上並沒有太大區別,因為該IP 已包含M 系列CPU 。據說其架構與NPU 有所不同(與更大的兄弟無關),且是專門為低功耗用例而設計。
就面積大小而言,U55 最小的32 MAC 實現,約為M55 的2 倍。這裡沒有絕對的數字提供,實際上討論的是平方毫米的分數。
與上一代解決方案相比,使用M55 和U55 的此類系統,其性能改進意味著相當重要的步進功能提升。與基於Cortex-M7 的系統相比,ARM 帶來了包含50 倍的性能提升、以及25X 的能效改進。
至於新IP的可用領域,ARM展望了各式各樣的嵌入式系統(主要是現有的芯片子系統)。比如在移動設備上,廠商可在手機的指紋傳感器、語音助理(實時監聽指令)、甚至在RF系統中(如天線調諧)使用它來優化工作負載。
當今的移動設備中,有數百種M 系列CPU 可從機器學習功能中獲益,且其中大多數功能對用戶來說是完全透明的。
目前ARM 已向主要合作夥伴開放M55 和U55 的授權,並將在未來幾個月內向更廣泛的客戶群開放,預計最終產品可在廠商二次開發的兩年後走向市場。