研究人員運用人工智慧即時生成可玩的《毀滅戰士》(Doom)
Google和特拉維夫大學的一些人創建了一個名為GameNGen 的新遊戲引擎,它完全由神經模型(又稱人工智慧)即時驅動。其重點是,他們訓練了一個強化學習代理(RL-agent)來玩《毀滅戰士》。這個RL 代理會一遍又一遍地玩遊戲,同時記錄並儲存每次的遊戲過程,學習如何不被射殺、吃掉或以其他方式死亡,同時也學習如何與環境進行簡單的互動。
其次是擴散模型–這實際上是一種學習模型,在對資料進行去噪處理以恢復影像昔日的光彩之前,透過許多步驟用雜訊破壞原本完美的影像,這使它在預測和創建影像方面非常出色。在這個特殊的案例中,它是一個遊戲引擎,能夠根據前一幀預測下一幀的遊戲內容。
透過觀察RL 代理重複玩DOOM 所獲得的數據,它可以產生所有紋理、顏色、模型、皮膚以及DOOM 地圖視覺化所需的其他一切。
通常情況下,紋理、精靈、模型、著色器、預製件等都保存在本地,並在每個關卡開始時載入。每個關卡還會預載獨特的實體互動。
擴散器模型可以預測並繪製下一幀的畫面,例如,武器發射時的樣子、發射的目標,以及霰彈槍對擊中物體的物理影響。再加上一些用戶輸入,現在你就擁有了一款AI生成的遊戲。遊戲是即時生成和互動的,沒有預先載入或快取。本例使用的是DOOM,但任何遊戲都可以使用。甚至是還不存在的遊戲。理論上,如果給GameNGen 一些參數,它也可以自己製作遊戲。
所有這些都是透過單一張量處理單元(TPU)實現的–TPU 類似於處理圖形的GPU,但專為人工智慧設計,用於大容量、低精度的計算處理–能夠達到20 fps。這與現代遊戲的60 fps 基準相去甚遠,但正如每項新技術一樣,它只會不斷進步。 1993 年的老式版本最高運行速度為35 fps。
在單一TPU 設定下,記憶體成為一個問題,人工智慧模型只能”記住”大約三秒鐘的遊戲時間,然後在使用者闖關時”忘記”。 雖然人工智慧能夠推斷出大部分數據,例如你的彈藥數量和你是否已經打過地圖上的某個特定區域,但由於上下文長度只有三秒鐘左右,有時會導致錯誤。
另一個值得注意的事實是,僅依靠RL 代理進行訓練也有其缺陷;與使用RL 代理試圖獲得最高分和找到FPS 遊戲中經常隱藏的所有秘密地點不同,訓練RL 代理的目的是從普通人可能的遊戲方式中收集資料。在訓練過程中,RL 代理可以存取其先前執行的32 次操作。
根據GameNGen 發布的白皮書,”我們的代理即使在訓練結束後,仍然無法探索所有的遊戲地點和交互,從而在這些情況下導致錯誤的行為”。
一直以來,電子遊戲都是由編寫了數百萬行程式碼的人來製作的。 GameNGen 是第一個依靠神經模型的遊戲;恕我直言,它可能會改變遊戲規則。
從最初在DOS 上發布,到由人工智慧運行生成……30 多年前,誰能想到這樣的事情?生成式人工智慧遊戲引擎是未來的趨勢嗎?我們是否只需擁有一台連接到網路的遊戲機,然後給它一些提示,就能開始玩完全按照我們的口味定制的獨特遊戲?