對戰DOTA2世界冠軍OG團隊OpenAI 稱這將是最終決戰
OPenAI 26 日宣布,在美國時間4 月13 日上午11:30(北京時間3 月14 日凌晨2:30),OPenAI 將挑戰第八屆DoTa2 國際邀請賽世界冠軍OG 團隊,比賽將在Twitch 上進行直播!OPenAI 官方稱此次比賽為“OpenAI Five Finals”,意為最終之戰!
OG 是由前“monkey”成員組成的新團隊。通過贏得2017 年的Kiev Major 比賽,OG 成為Dota 2中第一支贏得四場Dota 少年錦標賽的團隊。在去年8 月的第八屆DoTa2 國際邀請賽上,OG 團隊獲得冠軍,實力強勁。
OG 團隊的五名成員
OG 團隊將代表人類能力極限和OpenAI Five進行最終決戰。同時,和OPenAI 對戰的人類選手還有Blitz、Capitalist、ODPixel、Purge 以及Sheever ,遊戲規則與2018 年DoTa2 國際公開賽的五場比賽相似。
OPenAI 認為此次比賽可以說明人類和人工智能在未來將如何進行互動。OpenAI Five 戰隊將全方位演示人工智能的能力、可擴展性以及它如何提高人類的能力,而OPenAI 相信人工智能對世界的影響正是由這些方面驅動的。OPenAI 表示,他們希望這次直播能幫助人們更好地理解人工智能的進步以及它將如何影響世界。
OpenAI Five 比賽的示例
在OPenAI 看來,dota 2 是開發通用人工智能技術的一個好的試驗項目,此外,它也是幫助人們體驗人工智能的一條很好的途徑。OPenAI 希望從自動駕駛汽車等系統開始,人工智能將成為人們未來生活中的一個重要組成部分。
如何觀看比賽?
本次決賽將於4 月13 日在灣區舉行,暫定比賽時間為上午11:30 至下午4 點(具體結束時間取決於比賽時間)。
想親自到現場觀看比賽的童鞋們,請於3月29日星期五下午9:00前提出申請,邀請函將於3月31日星期日結束前發出。由於場地座位有限,OPenAI將根據申請者回答相關問題的情況確定可以入場觀看的人員名單。
如果你不能親自到現場觀看比賽,也可以在Twitch上觀看直播!
OpenAI 的DoTa 之路
2017 年,OpenAI 的人工智能進軍DoTa2,影魔solo 輕鬆擊敗頂級選手Dendi 和Sumail。隨後,OpenAI 宣布要在5v5 的 DoTa 比賽中擊敗人類。
OpenAI 對於 DoTa AI 的最終目標是開發出能夠打敗人類職業選手的 AI。然而,5v5 AI(OpenAI Five)相比之前來說是一個新的台階,它保留了諸多限制,遊戲環境和玩家們所熟悉的樣子有諸多不同。OpenAI Five 在這個環境裡做了多次迭代更新。
去年4 月23 日,OPenAI 首次打敗了自己編寫的基於腳本的基準模型,5 月15 日的版本與OpenAI 員工隊伍(天梯分段2500,高於46% 的玩家)打了一勝一負;而6 月6 日的版本則在與業餘戰隊(天梯分段4200,高於93% 的玩家)和半職業戰隊(天梯分段5500,高於99% 的玩家)的比賽中都贏得了三局中的前兩局。
但由於當時OpenAI Five 在遊戲中設定了諸多限制,極大地降低了遊戲的複雜度,比如隱身、肉山之類的禁用也縮小了戰略戰術的選擇空間,至於5 個無敵的信使就更像是對5 個AI 之間(也許並不理想的)協作能力的妥協。
不過,能打敗業餘和半職業戰隊的表現,在三局中贏得前兩局也說明了 AI 的策略選擇與執行的效果。即便遊戲中有一些限制,但OPenAI Five 還是有足夠的複雜度。
OpenAI 使用了256 個 V100 GPU 和128000 個 CPU 訓練模型,不使用人類數據,80% 的時間自我對弈,20% 的時間和過去的版本對弈。訓練中每天進行的遊戲數量時長相當於大約180 年。
另一方面,OpenAI Five 中使用的模型架構也出人意料地簡單。每一個英雄由一個單獨的 LSTM 模型控制,而它只是一個單層的、含有1024 個單元的LSTM 網絡。網絡從 Value (DoTa2 製作公司)提供的 BOT API 獲取數據,然後通過多個不同的動作輸出接口進行控制。
OpenAI Five 的網絡架構圖
在反饋的設計上,OPenAI 除了輸贏之外也選用了人類選手常用的指標:總財產、擊殺數、死亡數、助攻數、補刀數等等。但是為了避免 AI 過於關注這些偏向於短期策略的數據,他們的反饋設計只鼓勵 AI 在這些方面做到人類玩家的平均水平。
經過大半年的研究,今年,5v5 AI 能否戰勝人類冠軍?期待這次精彩的比賽!