英特爾大型神經擬態系統Hala Point整合11.5億神經元比人腦快200倍
Intel正式發布了代號「Hala Point」的新一代大型神經擬態系統,用於類腦AI領域的前沿研究,提升AI的效率和永續性。該系統基於Intel Loihi 2神經擬態處理器,在上代大規模神經擬態研究系統「Pohoiki Springs」的基礎上,進一步改進了架構,將神經元容量提高了10倍以上,達到史無前例的11.5億個,大致相當於貓頭鷹或卷尾猴的大腦皮質規模,性能也提高了多達12倍。
Loihi 2處理器早在2021年就已發布,首度採用Intel 4工藝,整合230億個電晶體、六個低功耗x86核心、128個神經形態核心,單顆就有100萬個神經元、1.2億個突觸,是上代規模的8倍,表現也提升了10倍。
Loihi 2應用了眾多類腦計算原理,如非同步、基於事件的脈衝神經網路(SNN)、存算一體不斷變化的稀疏連接,而且神經元之間能夠直接通信,不需要繞過記憶體。
尤其是在新興的小規模邊緣工作負載上,它實現了效率、速度和適應性數量級的提升。
例如執行AI推理負載和處理最佳化問題時,Loihi 2的速度比常規CPU和GPU架構快多達50倍,能耗則只有百分之一。
Hala Point系統的形態是一個六機架的資料中心機箱,大小相當於一個微波爐,內建1152顆Loihi 2處理器,共有140544個神經形態處理核心、11.5億個神經元、1280億個突觸,最大功耗僅2600瓦。
系統內還有2300多顆嵌入式x86處理器,用於輔助運算。
記憶體頻寬達16PB/s(16000TB/s),內核間通訊頻寬達3.5PB/s(3500TB/s),晶片間通訊頻寬達5TB/s,可每秒處理超過380兆次的8位元突觸運算、超過240兆次的神經元運算。
Hala Point在主流AI工作負載上的運算效率非常出色,例如運行傳統深度神經網路時,每秒可完成多達2萬萬億次運算(20PFlops),8位運算的能效比達到了15TOPS/W(每瓦特15兆次運算),相當於甚至超過了基於GPU、CPU的架構。
在用於仿生脈衝神經網路模型時,Hala Point能夠以比人腦快20倍的即時速度,運行其全部11.5億個神經元。
尤其是在運行神經元數量較低的情況下,它的速度甚至可比人腦快200倍!
早期研究結果表明,透過利用稀疏性高達10比1的稀疏連接和事件驅動的活動,Hala Point運行深度神經網路的能效比可高達15TOPS/W,同時無需對輸入資料進行批次處理。
Hala Point系統有望推動多領域AI應用的即時持續學習,例如科學研究、工程、物流、智慧城市基礎設施管理、大語言模型、AI助理等等。