清華開發出超高效能運算晶片:速度比高階GPU提升3000倍能源效率提升400萬倍
隨著各類大模型和深度神經網路湧現,如何製造出滿足人工智慧發展、兼具大算力和高能效的下一代AI晶片,已成為國際前沿熱點。中國科協發布的2023重大科學問題中「如何實現低能耗人工智慧」被排在第一位。
2023年10月25日,清華大學團隊在超高效能運算晶片領域取得新突破。相關成果以「All-analog photo-electronic chip for high-speed vision tasks」為題發表在Nature 上。
此晶片基於純類比光電融合運算架構,在包含ImageNet等智慧視覺任務實測中,相同準確率下,比現有高效能GPU算力提升3000倍,能源效率提升400萬倍。
圖1 相關論文(來源Nature )
未來已來?光為載體的運算晶片
要實現算力飛躍並非易事,特別是目前傳統的晶片架構,受限於電子電晶體大小逼近物理極限。全新運算架構成為破局的關鍵。
光運算以其超高的平行度和速度,被認為是未來顛覆性運算架構最有力的競爭方案之一。
光計算,顧名思義是將計算載體從電變為光,利用光在晶片中的傳播進行計算。面對以光速計算的誘人前景,數年來海內外知名科學研究團隊相繼提出多種設計,但要取代現有電子裝置實現系統級應用,仍面臨重大瓶頸:
一是如何在一枚晶片上整合大規模的運算單元(可控神經元),且約束誤差累積程度;
二是實現高速高效率的片上非線性;
第三是為相容於目前以電子訊號為主體的資訊社會,如何提供光運算與電子訊號運算的高效介面。
目前常見的類比數位轉換功耗,較光計算每步乘加運算高出多個數量級,掩蓋了光運算本身的效能優勢,導致光晶片難以在實際應用中體現出優越性。
系統級算力和能效,超現有晶片萬倍
為解決這個國際難題,清華大學團隊創造性地提出了模擬電融合模擬光的計算框架,建構可見光下的大規模多層衍射神經網路實現視覺特徵提取,利用光電流直接進行基於基爾霍夫定律的純類比電子運算,兩者整合在同一枚晶片框架內,完成了「感測前感測中近感測」的新型運算系統。
大幅降低了對於高精度ADC的需求,消除傳統電腦視覺處理範式在類比數位轉換過程中速度、精度與功耗相互制約的實體瓶頸,在一枚晶片上突破大規模整合、高效非線性、高速光電接口三個關鍵瓶頸。
圖2. 光電運算晶片ACCEL的運算原理與晶片架構(來源Nature )
在實測表現下,ACCEL晶片的系統級算力達到現有高性能晶片的數千倍。同時系統級能效達74.8 Peta-OPS/W,較現有的高效能GPU、TPU、光運算和類比電運算架構,提升了兩千到數百萬倍。
在超低功耗下運行的ACCEL將有助於大幅改善發熱問題,對於晶片的未來設計帶來全方位突破,並為超高速物理觀測提供算力基礎。同時為無人系統、自動駕駛等續航能力要求高的場景帶來重大利多。
表1. ACCEL和現有高效能晶片的系統級實測性能指標比較(資料來源:Nature )非相干光直接計算
更進一步,ACCEL晶片也支援非相干光視覺場景的直接計算,如論文中所示範的交通場景實驗。顯著拓展了ACCEL的應用領域,預計將顛覆目前自動駕駛、機器人視覺、行動裝置等領域先將圖片拍攝並保存在記憶體後進行計算的思路,避免傳輸和ADC頻寬限制,在感測過程中完成計算。
圖3. ACCEL可用於電子設備超低功耗人臉喚醒示意圖(資料來源:清華大學)
開闢新路徑:顛覆性架構可望真正落地
清華攻關團隊提出的新型運算架構不僅對於光運算技術的應用部署意義重大,對未來其他高效能運算技術與目前電子資訊系統的融合,也深有啟發。
論文通訊作者之一,清華大學戴瓊海院士介紹道,「採用全新原理研發出運算系統是一座大山,而將新一代運算架構真正落地到現實生活,解決國計民生的重大需求,是攀過高峰後更重要的攻關。”
Nature雜誌特邀在Research Briefing發表的研究專題評述也指出,「或許這項工作的出現,會讓新一代計算架構,比預想中早得多地進入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)」。
清華大學戴瓊海院士、方璐副教授、喬飛副研究員、吳嘉敏助理教授為本文的共同通訊作者;博士生陳一彤、博士生麥提·那扎買提、許晗博士為共同一作;孟瑤博士、週天贛助理助理、助理研究員、博士生李廣普、範靜濤研究員、魏琦副研究員共同參與了這項研究。