讓自行車“自動駕駛”:清華團隊的AI芯片“天機”登上Nature封面
自動駕駛汽車的發展需要AI已人盡皆知,但你應該沒有想到自行車也可以實現自動駕駛。其實,這是清華大學施路平教授團隊為驗證全球首款異構融合AI芯片設計的系統。該研究登上了頂級學術期刊《自然》(Nature)8月刊的封面,封面標題為《雙重控制》(Dual control)。
這篇名為《面向人工通用智能的異構天機芯片架構》(Towards artificial general Intel ligence with hybrid Tianjic chip architecture)的論文介紹了一款新型人工智能芯片,它結合了類腦計算和基於計算機科學的人工智能。
天機芯片是多學科融合的結晶,團隊成員來自清華大學、北京靈汐科技、北京師範大學、新加坡理工大學和加州大學聖塔芭芭拉分校,論文的第一作者有7位,清華大學的成員是核心。清華大學精密儀器系教授、類腦計算中心主任施路平為論文通訊作者。
自行車也能自動駕駛
為了驗證這款全球首款異構融合的AI芯片,研究團隊設計了無人智能自行車系統。論文的第一作者,加州大學聖塔芭芭拉分校博士後鄧磊認為,比起自動駕駛飛機,智能自行車看起來很小,但實際上是一個五臟俱全的小型類腦技術平台,“這實際上是對我們的考量”。
據悉,施路平團隊設計的無人智能自行車系統包括了激光測速、陀螺儀、攝像頭等傳感器,剎車電機、轉向電機、驅動電機等致動器,以及控制平台、計算平台、天機板級系統等處理平台等。
來源:nature
根據公佈的視頻,這一無人智能自行車系統可以實時感知周圍環境,跟隨前方的試驗人員並自動進行避障的操作,並根據語音指令、視覺感知的反饋產生實時信號對電機進行控制,以達到保持平衡,改變行進狀態(包括橫向和縱向)。
鄧磊介紹,無人自行車系統的語音識別、自主決策、視覺追踪功能運用了模擬大腦的模型,而目標探測、運動控制和躲避障礙功能運用了機器學習算法模型。
研究團隊還指出:“通過隨機將新變量實時引入環境中可以產生高時空複雜性,例如不同的道路條件、噪聲、天氣因素、多種語言、更多人等等。通過探索允許適應這些環境變化的解決方案,可以檢查對AGI至關重要的問題,比如概括、穩健性和自主學習。”
什麼是AGI?
這款芯片可以同時融合兩種方案正是其受到關注的關鍵所在。通用人工智能(Artificial General Intelligence,AGI),是一個尚未實現的研究課題,有時也被稱作強人工智能,它所描述的機器智能可以理解或學習人類所能完成的任何智力任務。
對於AGI,部分人工智能學者認為,AGI的概念並不嚴肅,在實踐中基本不可能實現。另一些人則十分看好人工通用智能的發展,認為它有可能塑造人類的發展軌跡。在Nature論文的新聞發布會中,施路平表示,“AGI是一個非常難的研究課題,但我們相信它是一定會實現的”。
施路平認為,發展通用人工智能的最佳方案之一是把人腦和電腦的優勢結合起來。
這種研究思路也就意味著要將計算機科學導向和神經科學導向這兩種發展AGI的方法結合在一起。但是這兩種方式在公式和編碼方案上存在根本差異,想要結合困難重重。
也就是說,這種結合的核心挑戰在於脈衝神經網絡(SNN)和人工神經網絡(ANN)的融合。
在生物大腦中,每個神經元都與各種輸入相連。一些輸入在神經元中產生激發,而另一些輸入則抑制它,對於SNN(脈衝神經網絡),在達到由變量(或者可能具有函數)描述的特定閾值狀態時,神經元發出脈衝信號。
ANN則是是從信息處理角度對人腦神經元網絡進行抽象,目前熱門的AI神經網絡CNN、RNN都屬於ANN。
就可以理解SNN和ANN最大的差異,ANN以精確的多位值處理信息,而SNN以脈衝處理信息。為了在一個平台上實現兩種模型,脈衝需要表示為數字序列(1或0),以便與數字編碼格式的ANN兼容。
當然,兩者之間還存在其它差異,比如SNN在時空域中運行,而ANN依靠時鐘在每個週期刷新信息。另外,SNN的計算包括膜電位積分,閾值交叉和電位複位,ANN主要與乘法累加(MAC)操作和激活變換相關。還有,SNN的處理需要比特可編程存儲器和額外的高精度存儲器來存儲膜電位,發射閾值和不應期,ANN僅需要用字節存儲器來進行激活存儲和變換。
全球首款異構融合AI芯片
鄧磊表示,兩類模型所使用的語言、計算原理、編碼方式和應用場景都不相同,實現這兩種模型深度高效的融合,是天機芯片設計中最大的挑戰。
天機芯片異構融合計算架構
清華研究團隊的解決方案是,建了一個跨範式的神經元方案,又設計了一個統一的功能核(FCore),這也是一項重要的創新,FCore的每個功能核包括軸突、突觸、樹突、胞體和神經路由器構建單元。通過可重構功能核靈活的建模配置和拓撲連接,編碼方式可以在ANN和SNN模式之間轉換,從而實現異構神經網絡。
當然,為了實現深度融合,幾乎整個FCore都可以重新配置,以便在不同模式下實現高利用率。FCore能夠涵蓋大多數ANN和SNN使用的線性積分和非線性變換操作。該芯片上的FCores以二維2D網格方式排列。
天機芯片設計圖示,來源:Nature
最終看到,天機(Tianjic)芯片由156個FCore組成,包含大約40000個神經元和1000萬個突觸,採用28納米半導體工藝製造,面積為3.8×3.8平方毫米。可以同時支持機器學習算法和類腦電路。
性能方面,天機芯片提供超過每秒610千兆字節(GB)的內部存儲器帶寬,以及運行人工神經網絡的1.28 TOPS的峰值性能。
在生物啟發的尖峰神經網絡模式中,天機芯片實現了每瓦約650千兆每秒突觸操作(GSOPS)的峰值性能。該研究團隊還展示了與GPU相比的卓越性能,其中新芯片的吞吐量提高了1.6-100倍,電源效率提高了12-10000倍。
論文作者、清華大學精密儀器系副研究員裴京透露,團隊的下一步計劃是面向問題商業化,把現有的、已經成熟的成果商業化推廣。另據施路平透露,目前,天機芯已經在北京靈汐科技有限公司開始進行下一步開發。