DeepMind最新人工智能可以執行600多項任務從玩遊戲到控制機器人
對人工智能行業的一些人來說,最終的成就是創造一個具有人工通用智能(AGI)的系統,或理解和學習人類所能完成的任何任務的能力。長期以來,AGI被歸入科幻小說的範疇,有人認為AGI將帶來具有推理、計劃、學習、代表知識和用自然語言交流能力的系統。
不是每個專家都相信AGI是一個現實的目標,甚至是可能的目標。由Alphabet支持的研究實驗室DeepMind本週發布了一個名為Gato的人工智能係統,為實現這一目標做出了貢獻。Gato是DeepMind描述的”通用”系統,一個可以被教導執行許多不同類型任務的系統。DeepMind研究人員訓練Gato完成了604項任務,確切地說,包括給圖像加標題,進行對話,用真正的機器人手臂堆積積木,以及玩雅達利遊戲。
艾倫人工智能研究所的研究科學家Jack Hessel指出,一個能夠解決許多任務的人工智能係統並不新鮮。例如,Google最近開始在Google搜索中使用一個名為多任務統一模型的系統,或稱MUM,它可以處理文本、圖像和視頻,以執行從尋找單詞拼寫的跨語言變化到將搜索查詢與圖像聯繫起來的任務。像所有的人工智能係統一樣,Gato通過實例學習,以標記的形式攝取了數十億字、來自真實世界和模擬環境的圖像、按下的按鈕、關節扭力等等。這些標記以Gato能夠理解的方式表示數據,使系統能夠找出《突圍》的機械原理,或者在一個句子中哪個詞的組合可能具有語法意義。
Gato不一定能很好地完成這些任務。例如,在與人聊天時,系統經常以膚淺或與事實不符的回答來回應。例如,在回答法國的首都是什麼時說”馬賽”,在給圖片加標題時,Gato給人加錯了性別。而且該系統在使用現實世界的機器人時,只有60%的時間能正確地堆放積木。但在上述604項任務中的450項,DeepMind聲稱,Gato在一半以上的時間裡表現得比專家好。奇怪的是,從架構的角度來看,Gato與當今生產中的許多人工智能係統並沒有明顯的不同。它與OpenAI的GPT-3有共同的特點,即它是一個”變形器”。追溯到2017年,Transformer已經成為複雜推理任務的首選架構,在總結文件、生成音樂、對圖像中的物體進行分類和分析蛋白質序列方面表現出了良好的能力。
也許更值得注意的是,就參數數量而言,Gato比包括GPT-3在內的單任務系統要小幾個數量級。參數是系統從訓練數據中學到的部分,基本上定義了系統在某個問題上的技能,如生成文本。Gato只有12億個,而GPT-3有超過1700億個。DeepMind的研究人員特意將Gato保持得很小,以便該系統能夠實時處理具體問題。