Google新型人工智慧可將影像轉化為可玩的小遊戲

生成式人工智慧主要以創建令人震驚的可信文字和靜態圖像而聞名，這種工具也已開始編輯相當逼真的影片剪輯。包括遊戲在內的互動體驗可能是下一步的發展方向之一。Google的研究可以讓人工智慧影響虛擬世界的構建，用人工智慧訓練人工智慧。

Google DeepMind 最近發布了一款人工智慧模型Genie，它可以利用靜態圖像製作小型互動遊戲。Google表示，這項技術背後的基礎可以促進其他應用，例如訓練人工智慧機器人。

Genie是在大約20 萬小時的公開遊戲畫面（可能來自Google子公司YouTube）基礎上訓練出來的。目前還不清楚使用它的人是否會與這些遊戲的創作者發生版權糾紛。

值得注意的是，人工智慧不需要文字或動作標籤來解釋它所看到的內容，它只需透過視訊畫面來解讀哪些元素應作為地形，哪些元素應作為可控制的頭像。Genie還能解讀影像中的三維深度，從而在遊戲中模擬視差滾動。

該工具可以根據繪畫、草圖、渲染圖、照片和其他類型的圖像建立小型視訊遊戲關卡。由於Genie可以處理它以前從未見過的圖片，因此它還可以根據人工智慧生成的內容構建環境，從而為使用一個人工智慧的內容在另一個人工智慧中創造新事物開闢了前景。

不過，還有改進的空間。與其他人工智慧模型一樣，Genie也會產生幻覺。此外，最初的迭代版本只能記憶多達16 個幀，這嚴重限制了它在保持一致的情況下建立關卡的大小。該模型1fps 的運行速度也有很大的進步空間。

為確保準確性，Genie 的初步演示專注於複製2D 平台遊戲。不過，Google表示，可以訓練它創造其他類型的遊戲和虛擬內容。

例如，Google表示，Genie 可以幫助更有效地訓練某些機器人。使用人工模擬進行的訓練只能提供有限的場景，而Genie 可以建立更廣泛的虛擬環境和對象，供機器人學習。

透過進一步開發，Genie 可以將互動式佈景變成生成式人工智慧的下一個主要領域。目前，影片正成為人們關注的焦點，尤其是OpenAI 在上個月推出了Sora，它可以製作逼真的60 秒1080p 短片。不出所料，人工智慧生成的視訊並不完美，但它代表了該技術的重大飛躍。

WONGCW 網誌