MIT研究人員發現深層神經網路並不會像人類一樣看待世界
麻省理工學院的神經科學家發現,深度神經網路雖然擅長識別圖像和聲音的各種呈現,但經常錯誤地將無意義的刺激識別為熟悉的物體或單詞,這表明這些模型發展出與人類感知不同的獨特的、特殊的「不變性」。該研究還表明,對抗性訓練可以稍微改善模型的識別模式,這提出了一種評估和增強感官知覺計算模型的新方法。 該研究的資深作者麥克德莫特說:「這篇論文表明,你可以使用這些模型來導出非自然訊號,這些訊號最終可以對模型中的表徵進行診斷。這項測試將成為我們這個領域用來評估模型的一系列測試的一部分。” Jenelle Feather 博士22 歲,現任Flatiron 研究所計算神經科學研究中心研究員,是這篇開放取用論文的主要作者,該論文今天發表在《自然神經科學》雜誌上。麻省理工學院研究生Guillaume Leclerc 和麻省理工學院Cadence 設計系統計算教授Aleksander Mądry 也是這篇論文的作者。近年來,研究人員訓練了深度神經網絡,可以分析數百萬個輸入(聲音或圖像)並學習共同特徵,使他們能夠像人類一樣準確地對目標單字或物體進行分類。這些模型目前被認為是生物感覺系統的領導模型。人們相信,當人類感覺系統執行這種分類時,它會學會忽略與物體核心身份無關的特徵,例如照射在物體上的光線數量或從什麼角度觀看物體。這被稱為不變性,意味著即使物件在那些不太重要的特徵上表現出差異,也會被認為是相同的。「傳統上,我們對感覺系統的思考方式是,它們為同一事物的不同示例可能具有的所有變異來源建立了不變性,」Feather說。“有機體必須認識到它們是同一件事,即使它們表現為非常不同的感官信號。”研究人員想知道,經過訓練來執行分類任務的深度神經網路是否可能會產生類似的不變性。為了嘗試回答這個問題,他們使用這些模型來產生刺激,這些刺激在模型內產生與研究人員給予模型的範例刺激相同的反應。