OpenAI洩密者Pavel Izmailov”光速”投奔馬斯克
剛被OpenAI開除的洩密者,光速投奔馬斯克。當事人Pavel Izmailov(以下簡稱小P),正是Ilya盟友之一,在Ilya領導的超級對齊團隊幹過。半個月前,小P被指疑似洩漏Q*相關機密而被開除。雖然不清楚他洩密了個啥,但當時鬧得沸沸揚揚。說時遲那時快,現在,他的Twitter個人簡介上,已經大張旗鼓寫著:研究員@xai。
要不說老馬招人下手快呢,除了小P,不少優秀人才近期都被馬斯克攬入麾下。
看熱鬧的網友炸開了鍋。稱讚他的人不少,說他幹得漂亮:
也有人嫌棄死了,覺得僱用洩漏機密資訊的人,這行為無異於撿垃圾。
而且最近xai的表現——包括發布Grok 1.5V在內,狠狠刷了波存在感,不由得引人感慨:
xAI將成為遊戲的主要參與者,與OpenAI、Anthropic分庭抗禮。
聘請OpenAI開除的洩密者
事情是這樣的,有個對大模型領域新鮮事極度關注的博主,有了個大發現:
馬斯克旗下xAI的新進員工,可不少啊? ? ?
而且其中還有數人研究方向與OpenAI最神祕的Q*演算法有點關係,看來馬斯克才是Q*的真正信徒。
具體是哪些人剛剛擇xAI而棲了呢?
最矚目的就是咱們開頭提到的小P。
他也是紐約大學CILVR小組成員,本人透露2025年秋將加入紐約大學Tandon CSE、Courant CS擔任助理教授。
半個月前,他的個人頁面還寫著,「在OpenAI搞搞大模型推理工作」。
半個月後,物是人非。
但小P的Twitter置頂還是沒有改變,是超級對齊團隊的第一篇論文,小P是這篇論文的作者。
超級對齊團隊組團於去年7月份,是OpenAI為因應不同時間尺度上大模型可能會產生的安全問題,成立的三大安全團隊之一。
超級對齊團隊負責遙遠的未來,為超越人類的超級智慧安全性奠定基礎,由Ilya Sutskever和Jan Leike領導。
說起來,雖然OpenAI看起來似乎在安全方面很重視,但其內部對AI的安全開發存在很大分歧已不是什麼秘密。
這種分歧甚至被認為是去年11月OpenAI董事會宮斗大戲的最主要原因。
網傳Ilya Sutskever成為「政變」帶頭人,就是因為看到了一些東西讓他內心不安。
而Ilya帶領的這個超級對齊團隊,很多成員也是站在Ilya這邊,在後來支持奧特曼的比心接龍活動中,這個超級對齊團隊成員也基本上保持了沉默。
然而宮鬥事件平息後,Ilya彷彿在OpenAI蒸發了一般,惹得外界流言四起,但他再也沒有公開露面過,甚至都沒在網上進行澄清或闢謠。
因此,超級對齊團隊現在是什麼情況,咱也不知道。
小P作為超級對齊團隊成員、Ilya部下,半個月前從OpenAI被畢業,被網友猜測是奧特曼的「秋後算帳」。
人才啊,他連夜投奔馬斯克
雖然外界還不知道Q*的全貌,但種種跡象表明,它致力於把大模型與強化學習、搜尋演算法等結合起來,增強AI推理能力。
除了最有八卦點的小P,以下幾位新加入xAI的人才研究方向多多少少與之相關。
Qian Huang,目前還是史丹佛大學的博士生。
去年夏天開始,Qian Huang在Google DeepMind工作,目前Twitter上已經註明了@xai,暫不知擔任什麼職務。
但從GitHub個人主頁可以看到,她的研究方向是將機器推理與人類推理結合起來,特別是新知識的合理性、可解釋性和可擴展性。
Eric Zelikman,史丹佛博士在讀生,Twitter上寫明「study why @xai」。
之前,他先後在Google研究院和微軟研究院待過一段時間。
他在個人主頁上說:“我對演算法如何(以及是否)能夠學習有意義的表示和推理很著迷,我正在xAI研究這回事。”
今年3月他團隊推出Quiet-Star演算法,確實也是Q*,讓大模型學會自己獨立思考。
Aman Madaan,卡內基美隆大學語言科技研究所博士在讀生。
他的研究領域包括大型語言模型、回饋驅動的生成以及程式碼生成和自然語言推理的交叉領域,研究的首要主題是使用推理時間計算(Inference-Time Compute)來增強推理能力(Reasoning)。
在攻讀博士學位期間,Aman曾擔任Google大腦和艾倫人工智慧研究所的學生研究員和合作者;更早以前,他還是Oracle的主要技術人員。
加上Pavel Izmailov在內的幾位新員工,自此馬斯克的技術人才版圖已擴增至34人(不包括馬斯克本人),相較於最開始12人的創始團隊成長了約2倍。
在新加入的成員當中,華人共計7人,加上創始團隊的5人,自此共有12人。
Xiao Sun,先前曾在Meta、IBM就職,博士畢業於耶魯,北大校友。
Ting Chen,先前曾在GoogleDeepMind、Google大腦就職,本科畢業於北郵。
Juntang Zhuang,此前曾在OpenAI就職,DALL-3、GPT-4核心貢獻者,本科畢業於清華,碩博畢業於耶魯。
Xuechen Li,今年博士畢業於史丹佛,羊駝Alpaca系列大模型的核心貢獻者。
Lianmin Zheng,UC柏克萊電腦博士,小羊駝Vicuna、Chatbot Arena創作者。
Qian Huang,史丹佛在讀博士生,畢業於天津南開中學。
Haotian Liu,威斯康辛大學麥迪遜分校,本科畢業於浙江大學,LLaVA一作。
而從機構分佈來看,主要還是集中在Google、史丹佛、Meta、OpenAI、微軟等機構,他們都有豐富的大模型訓練經驗, 例如GPT系列、大小羊駝系列,以及GoogleMeta相關大型模型。
從加入時間來看,更多還是集中在今年2-3月,平均每5天就有一名新成員加入共13人。去年8-10月間只有5人加盟。
而如果結合相對應Grok的進展,也能看到馬斯克xAI每一階段招募計畫。
例如今年3月29日,馬斯克突然發布Grok-1.5,上下文長度飆升,從原本的8192成長到128k,和GPT-4齊平。
而將時間推回一個月(今年2月),OpenAI前員工Juntang Zhuang加盟xAI。他在OpenAI發明了GPT-4 Turbo支援128k長上下文能力的演算法。
還有像今年4月15日,Grok-1.5V多模態模型發布,它能處理除文字訊息外,包括圖表、螢幕截圖、照片在內的各種視覺資訊。
而今年3月,LLaVA一作Haotian Liu才剛加盟。 LLaVA是端對端訓練多模態大模型,展現了類似GPT-4V的能力。而新版LLaVA-1.5 在11 個基準上實現了SoTA。
那現在不妨大膽設想一下, 新一波人才引進,Grok可能會有什麼樣的新升級呢?
網友:不管,Grok-1.5在哪裡(還沒開源)。
但不管怎麼說,根據先前馬斯克所說的人才標準來看,這位網友道出了「實情」:
大家都說老馬家大模型公司都是人才,其實人家馬斯克根本不在乎你有才沒才的。
人家說了,只要你能每週工作80小時還不崩潰,就能加入他們。
80小時? !
量子位掐指一算,不就是一週無休每天工作11.5個小時嗎…
別說智商了,這活從體力上咱就乾不了乾不了。
來源:“量子位”