下一代晶片來自中國科學家的突破
事實證明,人工智慧(AI) 和機器學習工具在處理需要分析資料並做出準確預測的各種任務方面非常有效。儘管這些工具具有諸多優勢,但它們對計算的需求很大,並且在現有處理單元上運行時會消耗大量能源。
北京大學和中國其他研究所的研究人員最近開發出一種基於碳奈米管的張量處理單元(TPU),該單元前景十分光明,可用於以更節能的方式運行AI 演算法。 《自然電子學》雜誌發表的一篇論文介紹了這種基於碳奈米管的張量處理晶片,這可能是開發下一代晶片道路上的關鍵突破。
「我們成功研發出全球首款以碳奈米管為基礎的張量處理器晶片(TPU),」論文共同作者張志勇(音譯)告訴Tech Xplore。 「我們受到了GoogleTPU和AI應用快速發展的啟發。從ChatGPT到Sora,人工智慧正在迎來一場新的革命,但傳統的矽基半導體技術越來越無法滿足大量數據的處理需求。面對這一全球挑戰,我們找到了解決方案。
在電腦科學中,收縮陣列是一種處理器網絡,可以有節奏地計算數據並允許數據自由通過,類似於血液在人體中的流動方式。張和他的同事開發了一種新的高效收縮陣列架構,使用碳奈米管晶體管,場效電晶體(FET),其通道由碳奈米管製成,而不是傳統的半導體。基於他們開發的這種新架構,他們創造了迄今為止報導的世界上第一個基於碳奈米管的TPU。
「該晶片由3,000 個碳奈米管場效電晶體組成,以3*3 處理單元(PE) 的形式組織起來,」張教授解釋。 “這9 個PE 構成一個脈動陣列架構,可以並行執行兩位整數卷積和矩陣乘法運算。”
張和他的同事提出的緊密耦合架構支持收縮輸入資料的流動。透過此架構的資料流動減少了靜態隨機存取記憶體(SRAM) 元件的讀寫操作,從而顯著節省了能源。
「每個PE 都從其上游鄰居(上和左)接收數據,獨立計算其內部的部分結果,並將其傳遞到下游(右和下),」張說。 “每個PE 都設計用於2 位元MAC 和有符號和無符號整數的矩陣乘法。結合收縮資料流,CNT TPU 可以加速NN 應用中的捲積運算。”
團隊提出的系統架構經過精心設計,可加速人工神經網路執行的張量運算,輕鬆在整數卷積和矩陣乘法之間切換。他們基於此架構開發的張量處理晶片可能成為基於低維電子學的新型高性能積體電路開發的重要里程碑。
「基於我們的碳基張量處理器晶片,我們建構了一個五層的捲積神經網絡,可以執行影像辨識任務,準確率高達88%,功耗僅為295μW,這是所有新型捲積加速硬件技術中功耗最低的。
“系統模擬結果表明,採用180奈米技術節點的碳基電晶體頻率可以達到850MHz,能效超過1TOPS/w,比同技術節點的其他器件技術具有明顯優勢。”
總體而言,研究人員進行的初步模擬和測試結果凸顯了碳基TPU 的潛力,表明它可能非常適合運行基於機器學習的計算模型。未來,他們的晶片可以比現有的基於半導體的設備表現出更大的運算能力,並且更節能。
研究團隊的努力最終將有助於加速卷積神經網路的運行,同時降低其功耗。同時,張和他的同事計劃進一步提高晶片的性能、能源效率和可擴展性。
張補充道:“例如,可以通過使用排列整齊的半導體CNT 作為通道材料、減小晶體管尺寸、增加PE 的位數或實現CMOS 邏輯等方式進一步提高這種方法的性能和能源效率。”
「CNT TPU 也可能在矽晶圓廠的BEOL 中製造,以實現三維集成:即底部是矽CPU,頂部是CNT TPU 作為協處理器。此外,可以研究多層CNT FET 的3D 單片集成,以獲得降低延遲和增加頻寬的潛在優勢。