索尼研究團隊《自然》雜誌上發文解釋如何訓練《GT賽車》遊戲AI
過去兩年時間裡,索尼一直在通過由1000 台PlayStation 4 遊戲機組建的虛擬訓練場,對名為“GT Sophy”的人工智能開展培訓。在去年7 月的一場單車比賽中,其已能夠超越真人玩家。然後10 月份的時候,它甚至在虛擬賽車比賽中將人類挑落馬下。
遊戲截圖
測試項目選擇了Polyphony Digital 開發的《GT 賽車》(Gran Turismo Sport),這是一款畫面真實、熱度相當之高的PlayStation 獨占遊戲。
而在最新實驗中,索尼希望證明人工AI 可在國際象棋/ 圍棋之外的賽事中也碾壓真人選手,即使這些遊戲被長期認為是由人類主導的。
有趣的是,AI 還曾在經典的雅達利視頻遊戲和《星際爭霸》即時戰略(RTS)遊戲中擊敗了人類選手。
當今的人工智能,通常特指基於神經網絡技術的計算機編程過程。該技術旨在模仿人腦的工作方式,而索尼的最新研究成果,已發表在周三出版的《自然》雜誌上。
對於《GT 賽車》之類的視頻遊戲來說,其最大的特色,就是提供了開放式的戰術選擇、以及模擬的物理規則。然而一位真人挑戰者表示,GT Sophy 選擇了新穎的路線來追趕他們。
Sony AI x Polyphony Digital Race Together – K.Yoshida Message(via)
在SONY AI 油管頻道分享的一段視頻中,曾於FIA《Gran Turismo 2020》世界總決賽中贏得三項挑戰的Takuma Miyazono 指出:
“人工智能在以一種我們永遠想不到的方式去駕駛,但在回看的時候,它又顯得相當合理”。
《Gran Turismo Sophy》的製作——SONY AI(通過)
據悉,GT Sophy 使用了一套被稱作“深度強化學習”(deep reinforcement learning)的技術路線。
起初這套完全未經訓練的系統並不知道它該干什麼,但通過遵循人工設計的獎勵機制,它最終掌握了比賽規則、然後一遍又一遍地掌控了比賽。
期間的難點,在於如何弄清賽車比賽中中的不成文規則,包括如何避免碰撞、以及適時地切斷競爭對手的路線。
索尼AI 總監Peter Wurman 補充道:
我們普遍低估了彰顯正確體育精神的難度,要做到這一點,我們必須不在競爭壓力下面露難色、過於膽怯或咄咄逼人。
最後,為了運行這套模擬,索尼使用了1000 台PlayStation 4 遊戲主機,並將之連接到了一台採用傳統處理器的計算機上。