利用DeepMind的這項技術AI也會玩《憤怒的小鳥》了
《憤怒的小鳥》,一款主流且經典的遊戲,自2009 年以來已經被下載了40 億次;大約是地球上總人口的半數。除此之外,它催生了眾多相關圖畫小說和書籍,兩部電影和四個系列動畫劇,更不用說在智能手機及其他平台上衍生出的無數遊戲,甚至是AR 版本的遊戲。
上圖為AR 版《憤怒的小鳥》之《豬島》
現如今,這款風靡全球的遊戲也受到了來自AI 的挑戰——AI 已經達到了該遊戲頂級玩家的同等水平。
本週,Arixiv.org 上發表了一篇論文,布拉格查爾斯大學的研究人員詳細介紹了一個叫作DQ-Birds 的AI 系統;該系統通過由Deepmind 率先提出的Deep Q-learning 算法訓練,從而在之前隨機取樣的環境下完成指定的任務。
通常,研究人員在利用Deep Q-learning 算法訓練AI 系統時,還會採取Double Q-learning 的算法;這種算法至關重要,因為它不是用來控制機器的下一步動作,而是用來評估決策。
研究人員在論文中寫道:
對於人工智能智能體來說,《憤怒的小鳥》這款遊戲十分棘手,因為它需要考慮順序和遊戲環境等隨機因素,還需要區分多種類別的小鳥,以及它們相應的能力和最佳點擊時間。如果想要成功地完成任務,人工智能智能體就要具備提前預測或模擬自己行動的後果。
為此,AI 系統會捕捉遊戲截圖(為了讓遊戲物理效果穩定下來,系統在拍照前會等待5 秒鐘),然後對其進行裁剪,並隱藏“菜單”和“再玩一次”等UI 元素。截圖經過裁剪後,系統會調整圖片的大小,讓它們呈相對統一的規範狀態,然後再傳送給Deep Q-learning 機器學習算法。
為了更加深入地了解自己的模型,該團隊還從《憤怒的小鳥》中經典的Poached Eggs 關卡里收集了21 個難度級別的數據集,其中包括超過11.5 萬個截圖。研究人員報告說,他們的AI 系統已經能夠在某些級別上超過一個由四名人類專業玩家組成的小組的分數,但在21 個難度級別的分數總和上還是略遜一籌,尤其是在過18級難度的關卡時。
除此之外,在IJCAI(International Joint Conference on Artificial Intel ligence,國際人工智能聯合會議)大會舉行期間,這個研究團隊還攜其AI模型參加了憤怒的小鳥AI競賽;這場競賽中,有幾個參賽選手的AI模型成功在三個回合中通過了8個此前從未接觸過的關卡,然而,DQ-Birds系統並沒有獲勝,但它成功通過了其中3個關卡,這已經比2017年的半決賽水平還要高了。
研究人員在報告中說道:
我們在這項工作中有一個目標沒有達成,那就是DQ-Birds 系統沒有完全超越人類;這有很大一部分原因在於該系統還缺乏足夠多樣的訓練數據集。但好消息時,DQ-Birds 在某些關卡已經能一次性過關。