ARM中國發布“周易”Z2 AIPU處理器:性能翻倍、最多32核心
ARM在中國的分支“安謀中國”此前雖然陷入了尷尬的人事動亂,但在技術和產品層面,ARM中國還是很有兩把刷子的,這幾年也結出了累累碩果。今天,ARM中國正式發布了“周易”Z2 AIPU,一顆針對深度學習而自主研發的創新性AI專用處理器(AI Processing Unit)。
它的單核算力最高可達4TOPS (每秒4萬億次計算),相比上代“周易”Z1 AIPU提升了一倍,同時可擴展至最多32個核心,從而能在單個SoC中實現128TOPS的強大算力。
2018年11月,ARM中國發布了名為“周易”的人工智能平台,“周易”Z1 AIPU也是ARM中國合資公司成立後第一款正式對外發布的本土研發IP產品。
該平台得到了很多中國客戶的信賴,多家廠商等已經完成相關產品研發和流片,比如全志科技的R329 AI語音專用芯片。
“周易”Z2 AIPU延用了此前的架構,並在微架構上進行優化,芯片面積減少30%,運行部分神經網絡模型時,相同算力配置下的性能提升可達100%,效率翻了一番。
內存子系統也進行了優化,併升級了高級帶寬節省技術(ABST),除了上代已有的權重壓縮(weight compression),還新增加了feature map壓縮技術。
它提供三種配置,分別是:4TOPS算力的Z2-1104、2TOPS算力的Z2-1002、1TOPS算力的Z2-0901。目前,LAC版本開發已完成,所有配置的EAC版本將在年底前向中國客戶提供。
“周易”Z2 AIPU主要面向中高端安防、智能座艙和ADAS、邊緣服務器等應用場景,客戶芯片預計2021年面世。
“周易”AIPU針對人工智能計算定義了一套新的適用於AI算法的指令集,通過指令驅動向量處理單元、固定AI算法處理單元,從而完成各種複雜網絡的組合的操作,支持各種AI計算,並具有很好的安全性。
它既有完全的可編程性,同時又有固定AI算力單元的高效率性,構成了相對平衡的平台型AI解決方案,還有仿真器、編譯器、調試器等全套開發工具,支持ARM NN、安卓NN等流行接口,TensorFlow、ONNX等主流AI框架,以及合作夥伴的自有OS、Runtime框架。