Google研究人員在自生成人工智慧模型上運行Doom
《毀滅戰士》(Doom)已經在幾乎所有能想像到的硬體上運行過。現在,Google的一個新項目利用這款標誌性遊戲以及圍繞它的無處不在的流行語,展示了一種利用人工智慧運行遊戲引擎的替代方法。開發人員認為,這可能是根據提示”生成”互動遊戲的第一步。
那些聲稱生成式人工智慧將使人們能夠完全透過提示來創作電影、電視節目或互動遊戲的人往往被視為騙子。然而,Google的一個新引擎最近利用標誌性的第一人稱射擊遊戲《毀滅戰士》(Doom)展示了在互動場景生成方面取得的重大進展。
修改者曾將Doom 移植到割草機、記事本、毫瓦神經晶片、圖文電視甚至是嵌套到其他遊戲中。但在Google和特拉維夫大學GameNGen 團隊的最新實驗中,他們利用基於Stable Diffusion的自訂擴散模型,即時渲染遊戲,成功生成了《毀滅戰士》關卡。
結果遠比以往使用人工智慧從頭開始生成遊戲的嘗試複雜得多。 GameNGen 複製的《毀滅戰士》在單一張量處理單元上以每秒約20 幀的速度運行,影像品質與1993 年的原版相似。人類觀察者在比較《毀滅戰士》的短片和人工智慧生成的克隆片時,只能以比隨機猜測稍高的準確度區分兩者。
此外,GameNGen 的模式是完全互動的。從片段中可以看出,它了解《毀滅戰士》中關於物品、彈藥、敵人、健康狀況和鑰匙卡門的基本規則。不過,在人工智慧生成的影像中也會出現輕微的視覺故障和典型的模糊效果。更嚴重的是,邏輯故障也時有發生。
例如,敵人可能會突然出現在玩家面前,物體可能會在被摧毀後重新出現。研究論文指出,出現這些不一致的情況是因為人工智慧只能記住遊戲的最後三秒鐘。儘管有這種限制,但它仍能從地圖和HUD 上的玩家狀態推斷出遊戲狀態的某些細節。 GameNGen 的短暫記憶是其目前的主要缺點。
研究人員將兩個分別訓練的程序結合起來,開發了這款引擎。首先,他們訓練了一個強化學習代理人來玩《毀滅戰士》。然後,他們根據RL 代理程式產生的動作和影格來訓練定製版的Stable Diffusion 1.4。
遊戲開發人員最近開始使用生成式人工智慧來完成資產創建和概念開發等任務。不過,研究人員認為,像GameNGen 這樣的技術有可能允許使用文字和視覺提示來編碼和編輯遊戲。