OpenAI給不了的DeepMind給Sora聯合負責人跳槽後開組新團隊
入職三個月,委以重任。在Sora 發布即翻車之前,其團隊掌舵人Tim Brooks 在社群媒體上宣布跳車,跳槽的去向還是競爭對手Google DeepMind。這消息立刻引發軒然大波。
根據The Information 爆料,Tim Brooks 的出走是因為Sora 技術存在嚴重問題:不僅生成速度慢,還在各項性能上都難以與Luma、Stability、Runway 等對手抗衡,更不用說最近風頭正勁的Pika 和國產影片生成模型們了。
在Sora 還在閉門造車的這段時間,競爭對手們已經在市場上攻城略地,打得火熱。
當時,有業內人士預測,Tim Brooks 加入Google後很可能會在其視頻生成模型Veo 項目上大顯身手。
不過,Sora 之所以驚艷不僅是影片生成的效果,更在於它能模擬真實世界的物理法則。世界模型的風正在AI 圈刮起:Google的GameNGen 能不用遊戲引擎就直接生成遊戲,最近大火的Oasis 更是能用視訊模型直接做出能玩的遊戲。視訊生成技術正在向模擬遊戲世界的方向狂飆。
而Tim Brooks 入職Google DeepMind 後的新任務,就是這個方向。早在DeepMind 聯合創始人Demis Hassabis 致的歡迎詞中就劇透過這一點,他們要將「久未實現的創造世界模擬器的夢想變成現實」。
本週一,Tim Brooks 在X 上宣布:“DeepMind 有雄心勃勃的計劃,要打造能夠模擬世界的大規模生成模型。我正在為這個使命組建一個新團隊。”
根據這個帖子中所附鏈接的招聘信息,這個新團隊將與Google的Gemini、Veo 和Genie 團隊合作,並在他們的工作基礎上,解決“關鍵性的新問題”,並將模型擴展到“最高計算水平」。
Gemini 是Google的旗艦人工智慧模型系列,可用於分析影像和生成文字等任務。 Veo 是Google自己的影片產生模型,最新的Veo 2 版本已經能一步生成美妝部落客開箱影片或Vlog,其逼真程度足以假亂真。
Google Veo 2 產生的Vlog 視頻,圖源:https://x.com/jerrod_lew/status/1872673797939044487
至於Genie,它是谷歌對世界模型的嘗試—— 一種可以即時模擬遊戲和3D 環境的人工智慧。就在上個月,Google震撼宣布了他們的新一代世界模型Genie 2,實現了輸入一張圖直接升維出一個互動可玩的3D 世界。
Genie 2 產生的可互動的虛擬世界
「我們相信,在影片和多模態資料上擴展人工智慧訓練是通往通用人工智慧的關鍵路徑,」一則職位描述中寫道,「世界模型將推動眾多領域的發展,例如視覺推理和模擬、具身智能體的規劃,以及即時互動娛樂。
Tim Brooks 團隊的招募要求
從上述JD 來看,Tim Brooks 新團隊將致力於在其構建的模型之上開發「即時互動生成」工具,並研究如何將其模型與現有的多模態模型(例如Gemini)進行整合。
主要招募的有兩個職位:研究科學家和研究工程師,年薪在136,000 美元—245,000 美元區間。
留言區的反應也很熱烈,履歷可能已經投上了。
世界模型是許多新創公司和大型科技公司追逐的焦點,例如李飛飛的World Labs、新創公司Decart 和Odyssey。他們認為,世界模型有一天可以用來創造能與觀眾即時互動的媒體,例如只屬於你的獨家遊戲劇情。同時,世界模型也能更好地模擬世界,解決機器人訓練環境缺乏資料的問題。
但原本靠創意吃飯的朋友們對世界模型的看法,可能就沒這麼樂觀了。
最近,《Wired》雜誌的一項調查發現,像動視暴雪這樣的遊戲工作室,已經裁減了大量員工,正在使用人工智慧來偷工減料、提高生產力,並彌補人員流失。 2024 年,由代表好萊塢動畫師和漫畫家的動畫師公會委託的一項研究估計,到2026 年,美國的電影、電視和動畫產業將有超過10 萬個職位受到人工智慧的衝擊。
不過,像Odyssey 這樣的AI 新創公司已經表態:他們的目標是與創意人士合作,而不是取代他們。至於Google能否用世界模型開創一個AI 與人類創意共生的新時代,讓我們拭目以待。