麻省理工學院研發的超快光子處理器可帶來極高的效率
由麻省理工學院科學家設計的新型光子晶片以光學方式執行所有深度神經網路運算,在奈秒內完成任務,準確率超過92%。這將徹底改變高需求運算應用,為可即時學習的高速處理器打開大門。
研究人員展示了一種完全整合的光子處理器,它可以在晶片上以光學方式執行深度神經網路的所有關鍵計算,從而為雷射雷達或高速通訊等計算要求苛刻的應用實現更快、更節能的深度學習。 圖片來源:電子學研究實驗室桑普森-威爾科克斯(Sampson Wilcox)。
深度神經網路是當今最先進的機器學習應用背後的驅動力,它變得如此龐大和複雜,以至於突破了傳統電子運算硬體的極限。
光子硬體使用光而不是電來執行機器學習計算,提供了更快、更節能的解決方案。 然而,光子設備很難實現某些神經網路操作,這就不得不依賴外部電子設備,從而減慢了處理速度,降低了效率。
經過十年的研究,麻省理工學院和合作機構的科學家們開發出一種突破性的光子晶片,克服了這些挑戰。 他們展示了一種完全整合的光子處理器,能夠完全利用光執行所有基本的深度神經網路運算,無需外部處理。該光學設備能夠在不到半納秒的時間內完成機器學習分類任務的關鍵計算,同時達到92% 以上的準確率–性能與傳統硬體相當。
該晶片由相互連接的模組組成一個光神經網絡,採用商業代工製程製造,可實現該技術的擴展和與電子產品的整合。
從長遠來看,光子處理器可為光達、天文學和粒子物理學科學研究或高速通訊等運算要求嚴苛的應用帶來更快、更節能的深度學習。
“在很多情況下,模型的性能好壞並不是唯一重要的,重要的是你能以多快的速度得到答案。”電子研究實驗室量子光子學和人工智慧小組的訪問科學家、NTT Research, Inc .的博士後Saumil Bandyopadhyay (17 年碩士、18 年工程碩士、23年博士)說:”現在我們有了一個端到端系統,可以在納秒級的時間尺度上在光學中運行神經網絡,我們就可以開始從更高的層面思考應用和算法了。”
與Bandyopadhyay 一起撰寫論文的還有:Alexander Sludds(18 年,19 年工程碩士,23 年博士);Nicholas Harris(17 年博士);Darius Bunandar(19 年博士);Stefan Krastanov(前RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE 研究科學家,現任RLE麻薩諸塞大學阿默斯特分校助理教授);RLE 訪問科學家兼NTT 研究公司資深科學家Ryan Hamerly; Matthew Streshinsky,前諾基亞矽光子學負責人,現Enosemi 聯合創始人兼首席執行官;Michael Hochberg,Periplous, LLC 總裁;以及Dirk Englund,電子工程與計算機科學系教授,量子光子學與人工智能小組和RLE 首席研究員,論文資深作者。 研究成果於12月2日發表在Nature Photonics. 上。
用光線進行機器學習
深度神經網路由多層相互連接的節點或神經元組成,它們對輸入資料進行運算以產生輸出。 深度神經網路的一個關鍵操作是使用線性代數來執行矩陣乘法,在資料從一層傳遞到另一層時進行轉換。
但除了這些線性運算外,深度神經網路還能執行非線性運算,幫助模型學習更複雜的模式。 激活函數等非線性運算賦予了深度神經網路解決複雜問題的能力。
2017年,恩格倫德的研究小組與塞西爾和艾達-格林物理學教授馬林-索爾亞契奇實驗室的研究人員一起,在單個光子晶片上演示了一個光神經網絡,它可以用光進行矩陣乘法運算。但當時,該設備無法在晶片上執行非線性操作。 光學資料必須轉換成電訊號,然後發送到數位處理器,才能執行非線性操作。
「光學中的非線性具有相當大的挑戰性,因為光子之間不容易相互作用。”Bandyopadhyay解釋說:”這使得觸發光學非線性變得非常耗電,因此建立一個能夠以可擴展的方式實現非線性的系統變得非常具有挑戰性。
他們透過設計稱為非線性光學功能單元(NOFUs)的設備克服了這一挑戰,這種設備結合了電子學和光學,可以在晶片上實現非線性操作。研究人員在光子晶片上建構了一個光學深度神經網絡,利用三層設備執行線性和非線性操作。
完全整合的網絡
首先,他們的系統將深度神經網路的參數編碼成光。 然後,2017 年論文中展示的可程式分光器陣列對這些輸入進行矩陣乘法運算。然後,數據進入可編程NOFU,NOFU 透過將少量光虹吸到光電二極管,將光訊號轉換為電流,從而實現非線性功能。 這一過程無需外部放大器,能耗極低。
“我們一直處於光域中,直到最後讀出答案。 這使我們能夠實現超低延遲,”Bandyopadhyay 說。
實現如此低的延遲使他們能夠在晶片上有效地訓練深度神經網絡,這一過程被稱為原位訓練,通常會消耗數位硬體的大量能量。這尤其適用於對光訊號進行域內處理的系統,如導航或電信,也適用於想要即時學習的系統。
光子系統在訓練測試中達到了96% 以上的準確率,在推理中達到了92% 以上的準確率,與傳統硬體不相上下。 此外,該晶片還能在不到半奈秒的時間內完成關鍵計算。
這項工作表明,計算–從本質上講,就是輸入到輸出的映射–可以編譯到線性和非線性物理學的新架構中,從而實現計算與所需工作量之間根本不同的比例規律。整個電路的製造採用了與生產CMOS 電腦晶片相同的基礎設施和代工製程。 這樣就能利用在製造過程中引入極少誤差的成熟技術,大規模製造晶片。
擴大設備規模並將其與相機或電信系統等實際電子設備整合將是未來工作的重點。 此外,研究人員也希望探索能利用光學優勢更快、更節能地訓練系統的演算法。
編譯自/ ScitechDaily