Imagination推出具有500 TOPS性能的神經駕駛輔助新平台
英國芯片設計公司Imagination Technologies,剛剛推出了面向高級輔助駕駛(ADAS)市場、名為IMG Series4 NNA的神經網絡新平台。在今日的公告中,該公司稱:隨著電動汽車的出現,已經蜂窩移動車聯網(C-V2X)連接平台的興起,汽車行業正在更加積極地擁抱新平台。
據悉,Imagination 的IMG Series4 NNA 平台建立在三大基礎上。公司宣稱這不僅使之能夠大規模擴展性能,還可減少延遲和帶寬功耗管理等工作負載。
性能方面,Imagination 預計Series4 神經加速器核心可達成介於每秒12.5 ~ 500 萬億次的運算(TOPS)。
此外通過高帶寬互連方案將單個Series4 與其它內核彼此相連,Imagination 還能夠組建最高8 路的系統集群。
集群中的內核不僅支持互連,也可通過系統總線來分隔出一組四個內核,輔以DDR DRAM 和內核上的緩存(OCM)。
Imagination 還承諾Series4 平台可提供高達30 TOPS / Watt 的能效,以及12 TOPS / mm² 的性能/單位面積。
更重要的是,這些芯片將基於最新的5nm工藝節點製造(比如台積電或三星等巨頭代工)。
其次,張量平鋪設計使得Series4 NNA 平台能夠進一步減少延遲。多核/ 多集群設計允許核心同時執行多項工作負載,或專注於單個工作負載。
若所有內核都被調配用於單一任務,則係統等待時間(處理器接收輸入至生成輸出的時間間隔),會在一定程度上減少已分配給該任務的內核數量。
如此一來,預計執行單一任務的單個內核,與執行相同任務的八核集群之間的延遲差異,會被拉大至8 倍左右。
此外內存管理也是Series4 NNA 平台上一個不可或缺的功能,Imagination 將之稱作Tensor Tiling(等待專利審批中),可節省高達90% 的帶寬開銷。
因其允許將神經網絡數據隔離為一個子集的子集,層數越多,神經網絡的構建也就更複雜。
接著通過張量平鋪來批處理劃分子集,並經由NNA 核心進行處理,以減少等待延遲和整體事務處理過程中對外部存儲器的依賴。
最後,Imagination 揭示了在添加更多內核情況下,Series4 平台的性能指標也可大致維持線性增長。
數據表明,對於某些類型的工作負載(34 層@ 2400×1200 的殘量網絡),其性能亦可完美地線性縮放。
當層數增加到50,且輸入圖像分辨率降低至224×224 時,線性縮放可近似至六個核心,之後這一梯度曲線才會開始向下彎曲。
此外Series4 也符合ISO2626 標準,能夠為汽車製造商達成更高的自動輔助駕駛水平而提供助力,以及為開發者提供處理各項應用時的張量平鋪優勢。