DeepMind發表Genie 2 一款可以產生可玩3D世界的AI模型
Google DeepMind(AlphaGo的幕後團隊)發布了Genie 2,這是一款開創性的工具,可根據單一圖像提示生成互動式3D 世界。 這個新模型旨在幫助訓練和測試人工智慧代理,讓他們可以使用鍵盤和滑鼠輸入與這些動態環境進行互動。根據DeepMind 的說法,它可以在各種互動環境中訓練和測試人工智慧代理,以下是其主要功能的細分:
動作可控: Genie 2 可對鍵盤和滑鼠輸入等動作做出反應,讓人或人工智慧與環境互動。 例如,當你按下方向鍵時,它就會明白必須移動角色,而不會錯誤地移動樹木或雲朵等物體。
Genie 2 可以記憶不再出現在視圖中的世界部分,並在它們回到場景中時進行渲染,從而使模擬感覺更加連續逼真。
即時創建新內容:它可以創建新的、一致的內容,同時隨著時間的推移保持世界的完整性,確保環境始終以可信的方式不斷發展。
Genie 2 可以對物理、重力和光線等複雜的交互作用進行建模,甚至可以製作角色動畫和模擬非遊戲角色(NPC) 的行為。 它可以處理從水流效果到角色移動和煙霧等一切效果。
反事實模擬:系統可以從同一起點產生不同的路徑。 這項功能讓研究人員可以測試不同的結果,為訓練目的提供了一種模擬各種體驗的方法。
真實世界圖像提示:不僅限於電腦生成的圖像,精靈2 還可以使用真實世界的照片作為提示,模擬風吹草動或水流等自然元素。
快速原型: 研究人員可以使用Genie 2 快速建立互動式體驗,以便在不同環境中進行快速測試和培訓。 它可以將概念藝術或圖紙轉化為完整的互動世界。
像Genie 2這樣的生成式人工智慧並非沒有爭議。 版權和智慧財產權問題是這一領域的主要癥結所在。 此類模型通常是在從互聯網上獲取的資料集上進行訓練的,其中有時包括受版權保護的資料。
藝術家、遊戲開發者甚至科技公司都對未經授權使用他們的內容來訓練這些模型表示擔憂。 在生成式人工智慧的其他領域, 已經出現了針對OpenAI 和Stability AI 等公司的訴訟,原告認為他們的作品未經許可被使用。 不難想像這裡也會出現類似的案件,尤其是當這些人工智慧產生的世界與人類創造的設計越來越難以區分時。
對資料採集行為的廣泛批評又增加了一層複雜性。 許多人對Meta 和X 等公司感到失望,因為這些公司使用其平台上的用戶資料來訓練模型,而這些資料往往未經用戶明確同意。