ARM發布Ethos-N57/N73 NPU、Mali-G57 Valhall GPU和Mali-D37 DPU
ARM今日隆重宣布了四款新芯片,分別是Ethos-N57和N73神經處理器(NPU)、Mali-G57 Valhall圖形處理器(GPU)、以及Mali-D37深度學習處理器(DPU)。去年年初的時候,該公司首次宣布了“Project Trillium”NPU產品線,並在幾個月後詳細介紹了其架構。在今年的TechCon大會上,ARM正式將其命名為Ethos系列。
![1.jpg](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/fcb4efeb77340f6.jpg?w=640&ssl=1)
(題圖via AnandTech)
作為Trillium 的主力產品,N77 的曝光度要高得多。不過在微體系架構上,與去年公佈的相比,全新的Ethos-N77 規格已有所變更和加強,支持分配1~4MB 的靜態隨機存儲器(SRAM)。
對此,ARM 的解釋是,客戶需要更多的內存帶寬,去處理網狀網絡的NPU 。因為動態隨機存儲器(DRAM)的帶寬,無法像核心數量一樣快地擴展到高端市場。
![2.png](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/f23dd9341c25b04.png?w=640&ssl=1)
該公司旗艦型號,可在1GHz 時種下提供高達4 TOPS 的運算能力、且每瓦特能效也是可觀的5 TOPS,ARM 宣稱其能夠在不同IP 上使用相同的構造塊。
所有NPU 共享相同的MAC 計算引擎(MCE)和可編程層引擎(PLE)。前者由去年公佈的128 個MAC 單元組成,並與PLE 配對。
![3.png](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/f0ce51e8d6254e0.png?w=640&ssl=1)
MCE、PLE、加上SRAM,則組成了計算引擎(CE)。作為可縮放的模塊,其在N77、N57 和N37 之間略有不同。就CE 數量而言,它就有16 倍、8 倍和4 倍的配置。
![4.png](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/1b08c305fe9562c.png?w=640&ssl=1)
中端和低端版本的發布速度,較其它新一些的IP 技術要快得多。因為ARM 認為,在每平方毫米的矽片成本都很受限的設備中,進行機器學習(ML)的興趣正變得越來越大。
特別是諸如智能機面部解鎖、或DTV 分辨率提升等功能,正在成為許多商家的宣傳重點,目前新NPU IP 已交付給許多授權客戶。
![5.png](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/27276c93f5782be.png?w=640&ssl=1)
然後要介紹的,是ARM 首款基於Valhall 的中端GPU,它就是Mali-G57 。在今年早些時候的Mali-G77 發布活動期間,ARM 已經透露過,預計我們可在明年的SoC 中見到它的身影。
與我們過去三年見到的基於Bifrost 的GPU 相比,新GPU 架構有了更大的變化,因為ARM 徹底重建了其圖形ISA 和計算的微體系架構。
![6.png](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/f9a4796643c4bb4.png?w=640&ssl=1)
今天,ARM 透露該公司將為中端GPU 新品(Mali-G57)引入Valhall 新架構,但並未披露有關新GPU 的更精細的微架構配置。預計G57 的方案會與G77 非常相似,但縮小到了G72 vs G52 的樣子。
與具有每核三個執行引擎(3EE)的G52 相比,改進後的G57 可保證將性能提升至1.3 倍左右、同時能效提升30%、矽密度也提高了30%(因為性能更強了) 。
![7.png](https://i0.wp.com/static.cnbetacdn.com/article/2019/1023/14c4d6e671772d8.png?w=640&ssl=1)
最後是Mali-D37 深度學習運算單元(DPU),作為ARM 的中端新主打,它將助力市場的更快普及。
今年早些時候,ARM 在發布Mali-D77 時宣布了新的DPU IP,並在Mali-D71 及後續產品中首次引入了“Komeda”架構。
然後新的DPU 將瞄準2K 和FHD 分辨率應用,承諾即使在使用16nm 製程的情況下,其核芯面積的佔用也不到1 mm²。