DeepMind 提出新架構:可實現更高級別推理
AI 究竟能否抓住推理的本質,也就是,對分佈在多個事實或記憶中的元素之間的遠距離關係實現認知?為此,Alphabet 子公司DeepMind 試圖從即將在Arxiv.org 上發布的一項研究中找到答案,該研究提出了一種具有遠距離推理能力的架構MEMO 。
按照研究人員說法,MEMO 有兩個新的組成部分:第一個介紹事實和存儲在外部存儲中的記憶之間的不同點,第二個則採用檢索系統,該系統允許在決定答案之前使用可變數量的“內存躍點”。
通過這兩個部分,可以使之能夠解決新型推理任務。
這個架構的靈感來源是海馬。論文的合著者寫道:
海馬以全新的方式支持單個經驗的靈活重組,以推斷出未觀察到的關係……這稱為推理。有趣的是,已經有證據證明,海馬是通過一個被稱之為模式分離(pattern separation)的過程彼此獨立地存儲記憶,以最大程度地減少記憶之間的干擾。最近的一項研究揭示了這一點:這些被獨立存儲記憶的整合出現在通過循環機制(該機制允許多個模式分離的代碼進行交互並因此支持推理)進行檢索的時候。
由此,DeepMind 的工作從這項研究中獲得啟發,以研究和增強機器學習模型中的推理。研究人員利用神經科學文獻,設計了一個過程生成的任務,稱為配對聯想推理(paired associative inference,簡稱PAI),該任務旨在通過迫使AI 系統學習抽象知識以解決先前未見的問題來獲取推理能力。
隨之,研究者們構建了MEMO,它能夠在提供輸入查詢時會輸出一系列可能的答案;而且為了盡量減少必要的計算,答案還多采用表徵的形式。
研究人員說,MEMO 在內存中保留了一組事實,並學習了一種與某種機製配合使用的映射方式,該機制在使用內存時具有更大的靈活性,並且它與典型的AI 模型不同,因為它使計算時間適應了任務的複雜性。在工作過程中,MEMO 從稱為REMERGE 的人類聯想記憶模型中獲取線索,該記憶將從記憶中檢索到的內容作為新查詢進行再循環,並使用再循環過程中不同時間步長檢索到的內容之間的差異來計算模型是否已適應在固定點上,隨後,MEMO 會輸出一個動作,該動作指示它是否希望繼續計算並查詢其內存,或者是否是能夠響應給定的任務。
在測試中,DeepMind 的研究人員在Facebook AI Research 的bAbi 套件(一組20 個評估文本理解和推理的任務)中將MEMO 與兩個基準模型以及當前的最新模型進行了比較,結果顯示,MEMO 能夠在PAI 任務上實現最高的準確性,並且它是唯一能夠在較長的序列上成功回答最複雜的推理查詢的體系結構。
此外,與性能最佳的基準模型的10 個步驟相比,MEMO 僅需要三個“躍點(hops)” 即可完成一項任務。在另一個需要模型在給定節點圖的情況下找到兩個節點之間最短路徑的任務中,面對更為複雜的節點圖,MEMO 比基準模型的表現好出了20%。