OpenAI洩密者Pavel Izmailov”光速”投奔馬斯克

2024-05-07 Comments 0 Comment

剛被OpenAI開除的洩密者，光速投奔馬斯克。當事人Pavel Izmailov（以下簡稱小P），正是Ilya盟友之一，在Ilya領導的超級對齊團隊幹過。半個月前，小P被指疑似洩漏Q*相關機密而被開除。雖然不清楚他洩密了個啥，但當時鬧得沸沸揚揚。說時遲那時快，現在，他的Twitter個人簡介上，已經大張旗鼓寫著：研究員@xai。

要不說老馬招人下手快呢，除了小P，不少優秀人才近期都被馬斯克攬入麾下。

看熱鬧的網友炸開了鍋。稱讚他的人不少，說他幹得漂亮：

也有人嫌棄死了，覺得僱用洩漏機密資訊的人，這行為無異於撿垃圾。

而且最近xai的表現——包括發布Grok 1.5V在內，狠狠刷了波存在感，不由得引人感慨：

xAI將成為遊戲的主要參與者，與OpenAI、Anthropic分庭抗禮。

聘請OpenAI開除的洩密者

事情是這樣的，有個對大模型領域新鮮事極度關注的博主，有了個大發現：

馬斯克旗下xAI的新進員工，可不少啊？？？

而且其中還有數人研究方向與OpenAI最神祕的Q*演算法有點關係，看來馬斯克才是Q*的真正信徒。

具體是哪些人剛剛擇xAI而棲了呢？

最矚目的就是咱們開頭提到的小P。

他也是紐約大學CILVR小組成員，本人透露2025年秋將加入紐約大學Tandon CSE、Courant CS擔任助理教授。

半個月前，他的個人頁面還寫著，「在OpenAI搞搞大模型推理工作」。

半個月後，物是人非。

但小P的Twitter置頂還是沒有改變，是超級對齊團隊的第一篇論文，小P是這篇論文的作者。

超級對齊團隊組團於去年7月份，是OpenAI為因應不同時間尺度上大模型可能會產生的安全問題，成立的三大安全團隊之一。

超級對齊團隊負責遙遠的未來，為超越人類的超級智慧安全性奠定基礎，由Ilya Sutskever和Jan Leike領導。

說起來，雖然OpenAI看起來似乎在安全方面很重視，但其內部對AI的安全開發存在很大分歧已不是什麼秘密。

這種分歧甚至被認為是去年11月OpenAI董事會宮斗大戲的最主要原因。

網傳Ilya Sutskever成為「政變」帶頭人，就是因為看到了一些東西讓他內心不安。

而Ilya帶領的這個超級對齊團隊，很多成員也是站在Ilya這邊，在後來支持奧特曼的比心接龍活動中，這個超級對齊團隊成員也基本上保持了沉默。

然而宮鬥事件平息後，Ilya彷彿在OpenAI蒸發了一般，惹得外界流言四起，但他再也沒有公開露面過，甚至都沒在網上進行澄清或闢謠。

因此，超級對齊團隊現在是什麼情況，咱也不知道。

小P作為超級對齊團隊成員、Ilya部下，半個月前從OpenAI被畢業，被網友猜測是奧特曼的「秋後算帳」。

人才啊，他連夜投奔馬斯克

雖然外界還不知道Q*的全貌，但種種跡象表明，它致力於把大模型與強化學習、搜尋演算法等結合起來，增強AI推理能力。

除了最有八卦點的小P，以下幾位新加入xAI的人才研究方向多多少少與之相關。

Qian Huang，目前還是史丹佛大學的博士生。

去年夏天開始，Qian Huang在Google DeepMind工作，目前Twitter上已經註明了@xai，暫不知擔任什麼職務。

但從GitHub個人主頁可以看到，她的研究方向是將機器推理與人類推理結合起來，特別是新知識的合理性、可解釋性和可擴展性。

Eric Zelikman，史丹佛博士在讀生，Twitter上寫明「study why @xai」。

之前，他先後在Google研究院和微軟研究院待過一段時間。

他在個人主頁上說：“我對演算法如何（以及是否）能夠學習有意義的表示和推理很著迷，我正在xAI研究這回事。”

今年3月他團隊推出Quiet-Star演算法，確實也是Q*，讓大模型學會自己獨立思考。

Aman Madaan，卡內基美隆大學語言科技研究所博士在讀生。

他的研究領域包括大型語言模型、回饋驅動的生成以及程式碼生成和自然語言推理的交叉領域，研究的首要主題是使用推理時間計算（Inference-Time Compute）來增強推理能力（Reasoning）。

在攻讀博士學位期間，Aman曾擔任Google大腦和艾倫人工智慧研究所的學生研究員和合作者；更早以前，他還是Oracle的主要技術人員。

加上Pavel Izmailov在內的幾位新員工，自此馬斯克的技術人才版圖已擴增至34人（不包括馬斯克本人），相較於最開始12人的創始團隊成長了約2倍。

在新加入的成員當中，華人共計7人，加上創始團隊的5人，自此共有12人。

Xiao Sun，先前曾在Meta、IBM就職，博士畢業於耶魯，北大校友。

Ting Chen，先前曾在GoogleDeepMind、Google大腦就職，本科畢業於北郵。

Juntang Zhuang，此前曾在OpenAI就職，DALL-3、GPT-4核心貢獻者，本科畢業於清華，碩博畢業於耶魯。

Xuechen Li，今年博士畢業於史丹佛，羊駝Alpaca系列大模型的核心貢獻者。

Lianmin Zheng，UC柏克萊電腦博士，小羊駝Vicuna、Chatbot Arena創作者。

Qian Huang，史丹佛在讀博士生，畢業於天津南開中學。

Haotian Liu，威斯康辛大學麥迪遜分校，本科畢業於浙江大學，LLaVA一作。

而從機構分佈來看，主要還是集中在Google、史丹佛、Meta、OpenAI、微軟等機構，他們都有豐富的大模型訓練經驗，例如GPT系列、大小羊駝系列，以及GoogleMeta相關大型模型。

從加入時間來看，更多還是集中在今年2-3月，平均每5天就有一名新成員加入共13人。去年8-10月間只有5人加盟。

而如果結合相對應Grok的進展，也能看到馬斯克xAI每一階段招募計畫。

例如今年3月29日，馬斯克突然發布Grok-1.5，上下文長度飆升，從原本的8192成長到128k，和GPT-4齊平。

而將時間推回一個月（今年2月），OpenAI前員工Juntang Zhuang加盟xAI。他在OpenAI發明了GPT-4 Turbo支援128k長上下文能力的演算法。

還有像今年4月15日，Grok-1.5V多模態模型發布，它能處理除文字訊息外，包括圖表、螢幕截圖、照片在內的各種視覺資訊。

而今年3月，LLaVA一作Haotian Liu才剛加盟。 LLaVA是端對端訓練多模態大模型，展現了類似GPT-4V的能力。而新版LLaVA-1.5 在11 個基準上實現了SoTA。

那現在不妨大膽設想一下，新一波人才引進，Grok可能會有什麼樣的新升級呢？

網友：不管，Grok-1.5在哪裡（還沒開源）。

但不管怎麼說，根據先前馬斯克所說的人才標準來看，這位網友道出了「實情」：

大家都說老馬家大模型公司都是人才，其實人家馬斯克根本不在乎你有才沒才的。

人家說了，只要你能每週工作80小時還不崩潰，就能加入他們。

80小時？！

量子位掐指一算，不就是一週無休每天工作11.5個小時嗎…

別說智商了，這活從體力上咱就乾不了乾不了。

來源：“量子位”

WONGCW 網誌

記錄生活經驗與點滴

OpenAI洩密者Pavel Izmailov”光速”投奔馬斯克

2024-05-07 Comments 0 Comment

相關

發表迴響取消回覆

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

分享此文：

相關

發表迴響取消回覆