IBM開發出NorthPole晶片全新架構緩解馮諾依曼運算瓶頸
位於加州聖荷西的IBM公司的研究人員開發出了一種受大腦啟發的電腦晶片,這種晶片能以更低的功耗更快地工作,從而為人工智慧(AI)提供超級動力。他們的大型NorthPole 處理器晶片無需頻繁存取外部記憶體,因此執行影像辨識等任務的速度比現有架構更快,同時功耗也大大降低。
IBM開發的NorthPole晶片將記憶體和處理功能結合在一起,大大改善了影像辨識和其他運算任務。
帕萊索巴黎-薩克雷大學的納米電子學研究員達米安-奎爾利奧茲(Damien Querlioz)說:”它的能效簡直令人難以置信。發表在《科學》(Science)上的這項工作表明,計算和記憶體可以大規模整合。這篇論文將撼動電腦體系結構的慣常思維」。
NorthPole運行神經網路:由簡單計算單元組成的多層陣列,透過程式設計來識別資料中的模式。底層接收數據,例如影像中的像素;每一層都能偵測到複雜度不斷增加的模式,並將訊息傳遞給下一層。頂層產生輸出,例如,可以表示影像中包含一隻貓、一輛車或其他物體的可能性有多大。
有些電腦晶片可以有效率地處理這些計算,但每次計算一個層時,它們仍需要使用RAM。這種在晶片間穿梭資料的方式會減慢速度–這種現像被稱為馮-諾依曼瓶頸(Von Neumann bottleneck),以數學家約翰-馮-諾依曼(John von Neumann)命名。
馮-諾依曼瓶頸是導致電腦應用(包括人工智慧)速度減慢的最重要因素之一。它還導致能源效率低下。該研究的合著者、IBM 公司的電腦工程師達門德拉-莫德哈(Dharmendra Modha)說,他曾經估計,在這種架構上模擬人腦可能需要相當於12 個核反應器的輸出功率。
NorthPole 由256 個計算單元或核心組成,每個單元或核心都有自己的記憶體。這在一個內核中就緩解了馮-諾依曼瓶頸。
隨後這些內核透過網路連結在一起,靈感來自於人類大腦皮質各部分之間的白質連結。這種設計原則和其他設計原則–其中大部分以前就存在,但從未在一個晶片中結合過–使NorthPole 能夠在標準的圖像識別基準測試中以相當大的優勢擊敗現有的人工智慧機器。儘管沒有採用最新和最微型化的製造工藝,它的能耗也只有最先進人工智慧晶片的五分之一。作者估計,如果NorthPole設計採用最新的製造工藝,其效率將比目前的設計高出25倍。
但是,對於大型語言模型(如聊天機器人ChatGPT 使用的語言模型)來說,即使NorthPole 擁有224 兆位元組的記憶體也是不夠的。而且該晶片只能運行預先編程的神經網絡,這些網絡需要事先在另一台機器上進行”訓練”。但論文作者表示,NorthPole 架構在速度要求極高的應用中可能非常有用,例如自動駕駛汽車。
NorthPole 使記憶體單元盡可能地接近核心中的計算元件。在其他領域,研究人員一直在利用新材料和製造流程進行更激進的創新。這些技術使記憶體單元本身也能進行運算,原則上可以進一步提高速度和效率。
上個月介紹的另一款晶片利用憶阻器(一種可以在電阻和導體之間切換的電路元件)進行記憶體計算。清華大學的高斌(Bin Gao)是憶阻器研究的共同作者,他說:”IBM 和我們的兩種方法都有望縮短延遲時間,降低資料傳輸的能耗成本。”
另一種方法是由多個團隊開發的,其中包括位於瑞士蘇黎世的IBM實驗室的一個團隊,它透過改變電路元件的晶體結構來儲存資訊。這些較新的方法能否以經濟的方式推廣還有待觀察。