DeepMind展示全能型人工智能模型Gato 可處理多項複雜任務
除了OpenAI 的DALL-E 2、Google 的PaLM、LaMDA 2、Deepmind 的Chinchilla 和Flamingo 之外,Deepmind 又展示另一個大型人工智能模型Gato,其性能超過了現有系統。
然而,Deepmind 的Gato 是不同的:該模型不能比其他人工智能係統更好地書寫文字,更好地描述圖像,更好地玩雅達利遊戲,更好地控制機械臂,或更好地在三維空間中定位。但Gato 可以做所有的事情。
Google DeepMind AI 的首席研究員表示,人工智能即將達到人類的智慧水平。Nando de Freitas 博士表示在這場長達數十年實現人工通用智能(AGI)的遊戲已經接近尾聲,該人工智能模型可以勝任從堆積木到寫詩等各種複雜任務。
Nando de Freitas 將Gato 描述為“通用代理”(generalist agent),只需要擴大規模,就能創造出能夠與人類智能相媲美的人工智能。
《The Next Web》之前發表了一篇名為《humans will never achieve AGI》(人類將永遠無法達到AGI)的文章,DeepMind 研究主管回應稱實現AGI 是不可避免的。
他在推文中寫道:“現在一切都與規模有關! 遊戲結束了!這都是關於使這些模型更大、更安全、計算效率高、採樣速度快、內存更智能、更多模式、創新數據、在線/離線……。解決這些挑戰才是實現AGI的關鍵”。
Deepmind 用圖像、文本、本體感覺、關節時刻、擊鍵以及其他離散和連續的觀察和行動來訓練基於Transformer 的模型,實現各種多才多藝的技能。在訓練階段,所有數據都由Transformer 網絡按標記序列處理,類似於一個大型語言模型。
該團隊隨後在604 個不同的任務中測試了Gato。在其中超過450 項任務中,該人工智能模型取得了專家在基準測試中的約50% 的表現。但這遠遠落後於能夠達到專家水平的專業人工智能模型。
Gato 只有11.8 億個參數,與1750 億個參數的GPT-3、巨大的5400 億個參數的PaLM 模型或700 億個參數的Chinchilla 相比,它的體量無疑是很小的。
根據該團隊的說法,這主要是由於所使用的Sawyer 機械臂的響應時間–更大的模型會太慢,無法在目前的硬件和目前的架構下執行機器人任務。
然而,這些限制可以通過新的硬件和架構輕鬆解決,該團隊說。一個更大的Gato模型可以用更多的數據進行訓練,並可能更好地完成各種任務。
該團隊說,最終,這可能會導致一個通用的人工智能模型,取代專門的模型–人工智能研究的歷史也表明了這一點。它引用了人工智能研究員理查德-薩頓的話,作為他研究的一個”慘痛教訓”指出:”從歷史上看,更善於利用計算的通用模型也傾向於最終超越更專業的特定領域方法。”
Deepmind 還表明,Gato 的性能隨著參數數量的增加而增加。除了大型模型之外,該團隊還訓練了兩個較小的模型,參數分別為7900 萬和3.64 億。平均性能隨著參數的增加而線性增加–至少對於測試的基準來說是如此。
在問及Gato 人工智能距離通過真正的圖靈測試(衡量計算機智能的標準,要求人類無法區分機器和另一個人)還有多遠的時候,機器學習研究員亞歷克斯-迪米卡斯(Alex Dimikas)的回答是“還很遠”。
在Twitter 上回答人工智能研究人員的進一步問題時,de Freitas 博士說,在開發AGI 時,安全是最重要的”。”他寫道:”這可能是我們面臨的最大挑戰。”每個人都應該思考這個問題。缺乏足夠的多樣性也讓我非常擔心。”
關於Gato 的描述,DeepMind 表示
這個代理,我們稱之為Gato,作為一個多模式、多任務、多組件的通用策略工作。具有相同權重的同一個網絡可以玩雅達利遊戲、給圖片加標題、聊天、用真正的機器人手臂堆積積木等等,根據其上下文決定是否輸出文本、關節扭力、按鈕按壓或其他標記物。