OpenAI首席科學家Ilya離開OpenAI了嗎?
Sora 一夜之間爆火全球。但奇怪的是,OpenAI 聯合創始人兼首席科學家伊爾亞·蘇茨克維(Ilya Sutskever)卻在保持沉默,沒有轉發任何一條關於Sora 的影片或推文。 Sora 目前沒有公開測試權限,僅向公司內部負責安全風險評估的紅隊成員(Red Teamers),以及極少數視覺藝術家、設計師和電影製作人提供存取權限。因此模型發布當天,OpenAI CEO 薩姆·奧爾特曼(Sam Altman)在社交平台X 上在線接單,基於用戶給出的提示詞一連發布了8 條影片。
OpenAI 聯合創始人兼總裁 Greg Brockman、CTO 米拉·穆拉蒂(Mira Murati)等人,也積極為Sora 宣傳。
但伊爾亞的最後一則推文,停留在了2023 年12 月15 日。
OpenAI 在其官網上的Sora 的文章後面留下了團隊成員的名字。在一串致謝名單中,我們看到了薩姆·奧爾特曼、格雷格·布羅克曼、米拉·穆拉蒂等人的名字,但唯獨沒有出現伊爾亞·蘇茨克維。
這不禁讓人懷疑,伊爾亞究竟是在埋頭研究GPT-5,還是已經離開了OpenAI ?
值得一提的是,OpenAI 創始成員之一、AI 技術研究員安德烈·卡帕蒂(Andrej Karpathy)在Sora 發布前夕離職。有網友大膽猜想:“如果Andrej 和Ilya 創辦一家真正開放的人工智慧公司怎麼辦?”
1.“我們終於知道伊爾亞看到什麼了”
今天,OpenAI 最新發布的Sora 模型再次讓人們感受到了人工智慧的強大,強大到令人害怕。
Sora 不僅僅是一個視訊生成模型,它湧現了對物理世界的理解能力(儘管還存在局限),OpenAI 直接將其定義為「世界模擬器」(world simulators)——它打開了一條通往模擬物理世界的有效路徑。不少人感慨,“現實不存在了”,“物理學不存在了”。
人們似乎在這一刻終於了解伊爾亞為什麼一直執著於人工智慧的安全性研究。強大的AI 模式對世界帶來的風險並非遙不可及。
有網友表示:「現在,我們知道伊爾亞看到什麼了。」伊隆馬斯克則在貼文裡留下了一個笑哭的表情。
去年,隨著GPT-4 以及後續一系列更強大的大語言模型的更新,以伊爾亞為代表的OpenAI 成員越來越多地考慮AI 的可控性問題。
為此,OpenAI 在2023 年7 月5日宣布成立一個新的團隊「超級對齊」(Superalignment),來研究引導和控制比人類聰明得多的AI 系統。這項計畫由伊爾亞與同事簡·萊克(Jan Leike)共同領導,並將OpenAI 20% 的算力專門用於該計畫的研究。
一般認為,去年11 月鬧得沸沸揚揚的OpenAI 「宮鬥事件」的導火線,就是伊爾亞對於AI 的發展理念與薩姆產生了分歧,伊爾亞越來越擔憂OpenAI 的技術可能造成極度危險的局面,他覺得薩姆對待AI 應該要更加謹慎。顯然,薩姆並沒有停下來。
在矽谷,對於AI的不同態度把人群分成了保守派與激進派。保守派也被稱為EA(Effective Altruism,有效利他主義),代表人物是「人工智慧教父」傑弗裡·辛頓(Geoffrey Hinton),伊爾亞就是他的學生。
激進派被稱為“e/acc(有效加速主義)”,許多知名的科技大佬、AI 從業者都是e/acc 主義的信徒。薩姆並未公開表達自己的立場,但考慮到他帶領下的OpenAI 一系列激進的產品發布節奏,事實上他已經成為e/acc 的代言人。
伊爾亞聯合董事會成員罷免了薩姆。但在大股東微軟的斡旋與OpenAI 全體員工請辭的壓力下,伊爾亞最終妥協讓步,薩姆在幾天后重新回到了OpenAI 並掌權,並重組了董事會。
宮鬥事件結束後,伊爾亞並沒有立即離開OpenAI,薩姆希望繼續他們之間的工作關係,並正在討論他如何繼續在OpenAI 的工作。
薩姆表達了對伊爾亞的謝意:“我尊重並熱愛著伊爾亞,我認為他是這個領域的指路明燈,也是人類的瑰寶。我對他的惡意為零。”
但去年外媒一篇報導曾指出,伊爾亞似乎處於一種「迷惘」的狀態,在OpenAI 變得「隱形」。自從薩姆回歸以來,伊爾亞就沒有出現在OpenAI 舊金山的辦公室內。馬斯克也向伊爾亞拋出了橄欖枝,他表示伊爾亞應該加入特斯拉或他的AI 公司xAI。
伊爾亞對於人工智慧安全的工作仍在繼續。 12 月14 日,OpenAI 發布了超級對齊專案的最新研究論文:使用GPT-2 級別的小模型來監督GPT-4 級別的大模型,並獲得接近GPT-3.5 級別的性能。同時,OpenAI 宣布與Eric Schmidt 合作,啟動了一項1000 萬美元的資助計畫支援技術研究,以確保超人類人工智慧系統的一致性和安全性。
身為論文核心作者之一的伊爾亞,也在X 上轉發了相關內容。但這是宮鬥事件至今,伊爾亞在X上轉發的關於OpenAI 進展的唯一內容。
我們暫時無法得知伊爾亞是否已經離開了OpenAI ,但他對於Sora 的沉默態度似乎並不尋常。
伊爾亞在簽名上寫著:“朝著擁抱人性多樣化的通用人工智能發展。”
2.人才是OpenAI 的核心競爭力
雖然伊爾亞並不在Sora 的研究團隊中,但Sora 仍然表現出了壓倒性的性能優勢,可見人才密度是OpenAI 領先的重要因素。
Sora 團隊整體非常年輕。核心成員有三位,分別是研究負責人Bill Peebles(比爾·皮布爾斯)與Tim Brooks(蒂姆·布魯克斯)與系統主管Connor Holmes。
Conner Holmes 曾是微軟研究員,在微軟工作時以外援形式參與了DALL·E 3 的推理優化工作,後來跳槽加入OpenAI 。
Bill Peebles 本科就讀於MIT,主修電腦科學,參加了GAN 和text2video 的研究,也曾在英偉達深度學習與自動駕駛團隊實習,研究電腦視覺。畢業後正式開始讀博之前,他還參加了Adobe 的暑期實習,研究的依然是GAN。
2022年5月,Bill 到Meta 進行了為期半年的實習,和謝賽寧( Bill 開始實習時還未離開Meta)合作發表了DiT 模型,首次將Transformer 與擴散模型(Diffusion Model)結合到了一起。從加州大學柏克萊分校博士畢業後,Bill 加入了OpenAI。
Sora 的模型架構,就是參考了Bill 與謝賽寧合作發表的DiT 論文。值得一提的是,該論文主要聚焦在了DiT 架構在影像生成領域的表現表現。有人推測,隨著Bill 加入OpenAI ,他很可能把自己在影片領域的研究成果,也帶到了OpenAI 的Sora 計畫。
Sora 的另一個核心作者是Tim Brooks,曾在Google 負責Pixel 手機相機的機器學習工作,以及在英偉達負責視訊生成模型研究。
2023 年從加州大學柏克萊分校博士畢業後,Tim 加入OpenAI,參與了DALL·E 3 相關研究。
在其他幾位作者中,也包括兩位華人Li Jing 與Yufei Guo。
今天,上海交大校友、目前在紐約大學擔任助教的謝賽寧在朋友圈闢謠了自己是Sora 作者之一的消息。他表示,Sora 是Bill 他們在OpenAI 的嘔心瀝血之作,雖然不知道細節,但他們每天基本上不睡覺高強度工作了一年。
同時,謝賽寧也對Sora 發表了他的觀點:
第一,對於Sora 這樣的複雜系統,人才第一,數據第二,算力第三,其他都沒有什麼是不可取代的;
第二,在問Sora 為什麼沒出現在中國的同時,可能也得問問假設真的出現了(可能很快),我們有沒有準備好?
如何確保知識和創意的通暢準確傳播讓每個人擁有講述和傳播自己故事的“超能力”,做到某種意義上的信息平權。但是又不被惡意利用,變成某些人某些組織的謀利操縱工具。 oai 有一整套的redteaming, safety guardrail 的研究部署,歐美有逐漸成熟的監管體系,我們準備好了嗎?
這件事跟技術成熟前,生成點小打小鬧的漂亮圖片不是一個量級,真相捕捉和黑鏡裡講的故事,很有可能很快就會變成現實。
(封面圖來自X,左為安德烈·卡帕蒂,右邊為伊爾亞·蘇茨克維)