Google正在組建一支新團隊以打造能夠模擬物理世界的AI
Google正在組建一個新的團隊,研究能夠模擬物理世界的人工智慧模型。蒂姆-布魯克斯(Tim Brooks)是OpenAI 視訊產生器Sora的共同負責人之一,他於10 月前往Google的人工智慧研究實驗室Google DeepMind以領導這個新團隊。
“DeepMind 有一個雄心勃勃的計劃,那就是建立大規模的生成模型來模擬世界,」布魯克斯週一上午寫道。 “我正在為一個肩負這項使命的新團隊招募人”。
根據布魯克斯在帖子中鏈接的職位列表,新的建模團隊將與Google的Gemini、Veo和Genie 團隊合作,並在此基礎上解決”關鍵的新問題”,並將模型擴展到”最高的計算水平”。 Gemini 是Google的旗艦人工智慧模型系列,用於分析影像和生成文字等任務,而Veo 則是Google自己的視訊生成模型。
至於Genie,它是Google的世界模型–可以即時模擬遊戲和3D 環境的人工智慧。 Google最新的精靈模型於12 月預覽,可以產生大量可玩的3D 世界。
由DeepMind 的Genie 2 模型產生的互動式遊戲世界。圖片來源:DeepMind
“我們相信,在視頻和多模態數據上擴展[人工智慧訓練]是通往人工通用智能的關鍵之路,”其中一份職位描述這樣寫道。 人工通用智能,或稱為AGI,一般是指能夠完成人類所能完成的任何任務的人工智慧。 “世界模型將為眾多領域提供動力,例如視覺推理和模擬、化身代理的規劃以及即時互動娛樂。”
根據描述,布魯克斯的新團隊將尋求在他們建立的模型之上開發”即時互動生成”工具,並研究如何將他們的模型與現有的多模態模型(如Gemini)整合在一起。
許多新創公司和大型科技公司都在追逐世界模型,其中包括頗具影響力的人工智慧研究員李飛飛的世界實驗室、以色列新貴Decart和Odyssey。 他們認為,世界模型有朝一日可用於創建電玩遊戲和電影等互動媒體,以及運行機器人訓練環境等逼真模擬。
但創意人員對這項技術的看法卻褒貶不一。
《連線》(Wired)最近的一項調查發現,動視暴雪(Activision Blizzard)等遊戲工作室正在使用人工智慧來偷工減料、提高生產力並彌補人員流失。 2024 研究 是由代表好萊塢動畫師和漫畫家的動畫工會(Animation Guild)委託進行的,該工會估計,到2026年,美國將有超過10萬個電影、電視和動畫工作崗位將被人工智慧顛覆。
在新生的世界建模領域,一些新創公司,如Odyssey,已經承諾與創意專業人士合作,而不是取代他們。 Google是否會效仿,我們拭目以待。
還有一個尚未解決的版權問題。 一些世界模型似乎是根據視頻遊戲的播放片段訓練出來的,這可能會使開發這些模型的公司在視頻未獲授權的情況下成為訴訟對象。
YouTube的所有者Google聲稱,根據YouTube平台的服務條款,Google有權在YouTube影片上訓練其模型。 但該公司沒有說明它正在尋找哪些具體影片進行訓練。