OpenAI元老級研究員Alec Radford離職曾主導GPT-1、GPT-2的研發

2024-12-22 Comments 0 Comment

OpenAI 連續12 天發表會還剩最後一天，期待中的”重磅”遲遲沒來，反而失去了一位核心研究人員。 OpenAI 人事方面的變動仍在繼續。今日，根據外媒The Information 報道，OpenAI 元老級人物Alec Radford 即將離職，離職後進行獨立研究。

據了解Radford 資訊的人士透露，Radford 表示他計劃與OpenAI 以及其他AI 開發者展開合作。

OpenAI 研究主管Mark Chen 在一份聲明中表示：“我們對Alec 及其貢獻有著深深的敬意和感激，並期待在他探索獨立研究的同時，繼續與他合作開展項目。”

也許你沒聽過Radford 這個人，但他參與的研究卻是重量級的，在他2016 年加入OpenAI 後，帶來了一系列革命性突破，比如大家熟知的初代GPT，還主導了GPT- 2 的研發等等。

在前幾天火熱進行的NeurIPS 2024 大會上，OpenAI 前首席科學家Ilya Sutskever 在他的演講中特別提到了Alec Radford、 Dario Amodei 等人參與的GPT-2、GPT-3 開創性工作，它們推動了預訓練時代以及所有進步的來臨。

有人猜測，Radford 的離職預示著GPT-4.5 就要來了。因為之前OpenAI 高階語音模式發布後的第二天，技術長Mira Murati 長宣離職。這麼推算下來，作為GPT 系列的重磅參與者，GPT-4.5 很可能就是明天發布（畢竟是OpenAI 連發12 天的最後一天）。

對此，有人贊同的表示：“也許他想在離開之前完成手頭的項目。這並非完全不可能。”

在這條評論下，有人回答「他雖然做了深入研究，但沒有參與任何發布（沒有走到台前，一直在幕後），不像Murati 或其他已經離開的人。如果他必須等待某件事，那麼在GPT-5 發布後離開會更合適。情況，對他們來說，前景看起來很暗淡。

也有人表示人們低估了Alec 對OpenAI 以及整個AI 研究的影響。他不僅是GPT 和Dall-E 的主要作者，而且很可能引領了公司所有重要的研究方向。甚至表示他的影響力不亞於Ilya。這對OpenAI 來說是一個巨大的損失，但網友同時也希望Alec 可以做一些開放的研究並發表一些東西，這樣整個世界都可以受益。

在此之前，不列顛哥倫比亞大學教授Jeff Clune 在X 上發起了一個討論，「誰是世界上最重要但又最被低估的AI 科學家？在我看來，只有一個明確的正確答案。大多數重大進展背後都有一個人，卻很少被提及或慶祝。

Jeff Clune 毫不猶豫的推薦了Alec Radford，「Radford 顯然是影響力最大但知名度最低的人。他推動了許多令人驚嘆的發展，他應該作為現代生成式人工智慧之父載入史冊。Radford 也是一個非常好的人，不追求榮譽，這也是他很少受到關注的部分原因。我們更有理由談論他對人工智慧的巨大影響！

“Radford 的研究絕對是領先的。他的貢獻絕對是驚人的，至少三次改變了這個領域！我們欠他很多。”

他全程參與了GPT 系列模型的研發

Alec Radford 是GPT-1 的一作、GPT-2 的共同一作，其中GPT-1 的被引數已經達到了11947，GPT-2 的被引數為14828。

2018 年，GPT-1 開啟了預訓練大模型時代，提出「半監督（semi-supervised）」（後來普遍稱為自監督）的方法，先在沒有標號的數據上面訓練一個預訓練模型，再在少量標號資料上面訓練一個分辨的微調模型。

2019 年，OpenAI 在GPT-1 的基礎上發布了GPT-2，利用無監督預訓練模型做有監督任務。相較於初代模型進行諸多改進，GPT-2 參數達到15 億，可以執行多樣性任務，開始學習在不需要明確監督的情況下執行數量驚人的任務。在GPT-2 階段， OpenAI 去除了GPT-1 階段的監督微調（fine-tuning），成為無監督模型。

GPT-1 論文：https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf

GPT-2 論文：https://cdn.openai.com/better-language-models/language_models_are_unsupervised_multitask_learners.pdf

不僅如此，Alec Radford 也參與了GPT-3 論文的撰寫、以及GPT-4 的預訓練資料與架構研究工作

2020 年，到了GPT-3 階段，參數相較於GPT-2 增加兩個數量級以上，達到了1750 億參數，在許多NLP 數據集上都有很強的性能（包括翻譯、問題解答和完形填空任務），以及一些需要動態推理或領域適應的任務（如解譯單字、在句子中使用一個新單字或執行算術）。

2023 年，GPT-4 開始邁向多模態模型，成為AI 新里程碑，可以解決更複雜的問題、編寫更大型的程式碼，並透過圖片產生文字。 GPT-4 的回答準確性不僅大幅提高，還具備更高水準的識圖能力，且能夠產生歌詞、創意文本，實現風格變化。

GPT-3 論文：https://arxiv.org/pdf/2005.14165

GPT-4 技術報告：https://arxiv.org/pdf/2303.08774

根據Google Scholar 顯示，Alec Radford 的論文被引總數超過了19 萬，其中1 萬以上的達到7 篇，足可見其參與工作的含金量和影響力。

https://www.theinformation.com/briefings/senior-openai-researcher-radford-departs

My answer: Alec Radford.

There were good suggestions below, but to my mind @AlecRad is clearly the person with the largest influence, yet the least recognition. He's been the driver so many amazing developments and should be in the history books as a (the?) father of modern… https://t.co/E7rrZ3tcCE
— Jeff Clune (@jeffclune) October 1, 2024

Alec Radford, the lead author of OpenAI's original GPT paper, is leaving to pursue independent research
byu/MassiveWasabi insingularity

WONGCW 網誌

記錄生活經驗與點滴

OpenAI元老級研究員Alec Radford離職曾主導GPT-1、GPT-2的研發

2024-12-22 Comments 0 Comment

相關

發表迴響取消回覆

2024 年 12 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

分享此文：

相關

發表迴響取消回覆