GoogleDeepMind推出Genie模型：110億參數、可基於圖片生成2D遊戲

2024-02-27 Comments 0 Comment

谷歌發布了新互動模型—Genie，該技術將為AI領域帶來革命性的突破。據了解，Genie共有110億個參數，能夠基於用戶輸入的一張圖片和提示詞，生成一款較為完整的2D平台遊戲。Genie三由個部分組成：一個潛在動作模型，用於推斷每對幀之間的潛在動作；一個視頻tokenizer，用於將原始視頻幀轉換為離散token。

另一個動態模型，用於在給定潛在動作和過去幀token的情況下，預測影片的下一幀。這三個元件共同協作，使得Genie能夠產生具有高度互動性和可控性的虛擬世界。

Genie通過了網路上超過20萬小時的2D遊戲影片訓練，目前只是一個研究預覽版，這些遊戲更像是2D平台遊戲，而不是完全的VR遊戲。

此外，它能產生圖像和其他資產，將你的草圖變成一個完全實現的開放世界，然後根據玩家提供的操作預測下一個像素幀，Genie還可以應用於設計相關的創作領域，進一步拓寬了創作者的想像空間。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

WONGCW 網誌

記錄生活經驗與點滴

GoogleDeepMind推出Genie模型：110億參數、可基於圖片生成2D遊戲

2024-02-27 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆