Meta內部“算力宮鬥” 一半Llama核心團隊已離職
Meta是市場上最出色的開源大模型提供方,但據報導,該公司內部存在混亂和內鬥,許多工程師和科學家已經離職,主要原因是Meta內部團隊之間在算力分配上存在分歧。在過去半年的AI混戰裡,提供免費開源大模型的Meta,成了與眼裡只有生意的谷歌、微軟&OpenAI截然相反的平民英雄。
然而,儘管憑藉Llama,Meta已經拿下了“大模型裡的安卓”的名頭,但據科技媒體The Information報導,團隊內部實際上充滿了混亂和內鬥,許多參與開發的工程師和科學家都已經離職。知情人士表示,2月份發表的Llama原始研究論文的14位作者中,有一半以上已經離開了公司,有幾位去了人工智能初創公司或其他大公司。
算力宮鬥
導致Meta內鬥的主因,是算力。
以圖靈獎得主Yann LeCun為首的The Fundamental AI Research (FAIR) 實驗室,主導著Meta的AI研究和開發。FAIR在加州、紐約、巴黎、倫敦等地都有分支機構,但各地實驗室之間缺乏統籌,甚至可以稱得上山頭林立。
例如,2022年5月,一個主要位於美國的FAIR團隊發布OPT-175B,對標OpenAI的GPT-3,據稱能耗比GPT更低,這個團隊也在開發對標谷歌PaLM、參數量級更大的模型。
與此同時,FAIR巴黎團隊也在開發他們的大模型——即Llama,後者的參數比OPT要小,因為巴黎團隊相信,小模型在推理方面效率更高。
多線並進沒有給Meta帶來好結果。英偉達的算力供給昂貴而有限,即使是Meta,也沒有足夠的GPU滿足兩個團隊同時推進。
兩位直接知情人士對The Information表示,由於Meta的GPU資源不足,巴黎團隊和美國團隊關係變得越來越緊張。據知情人士透露,巴黎團隊獲得的算力配額比美國團隊要少。
FAIR負責人Joelle Pineau對The Information表示,算力分配是由多部門的中層領導每月開一次會來決定的,主要考慮的是組織的優先級,以及項目發布日期。如果員工們對算力分配有異議,需要層層上報等Pineau來定奪。
在採訪中,Pineau承認Llama與OPT各自的開發團隊在這個問題上“有些緊張”。
據The Information了解,許多研究人員實際上都不理解FAIR為什麼要採取多線並進的方式。兩個團隊都在做大模型,看起來似乎是在鼓勵內部競爭。
內鬥再加上Meta去年底的大裁員和公司組織調整,Llama和OPT的開發團隊都出現了士氣問題,多位關鍵研究人員選擇離職加入其他大科技公司或AI初創企業。
直到今年2月份,FAIR終於把兩家人馬收攏到一起,全力開發Llama2,而OPT模型則被徹底放棄。原因倒不在於Llama比OPT出色,而是因為沒人了——5月份OPT論文的19位作者中,已經有一半離開了Meta。
商業化轉向提速FAIR未來命運存疑
從去年11月開始,Meta CEO 扎克伯格開始在全公司範圍內進行裁員,FAIR也未能倖免。
此外,今年2月,Meta成立了一個新團隊,專注於自家App開發AI功能。新團隊由蘋果前高管Ahmad Al-Dahle負責,從FAIR吸納了大量人員。據Pineau稱,其中包括開發Llama 2的團隊。
更重要的是,AI熱潮之下,FAIR所肩負的使命也發生了微妙的變化。之前,它和OpenAI一樣,是一個由研究人員領導的學術研究機構,以人工智能領域技術攻堅為核心使命。但扎克伯格後來愈發希望加速令AI技術商業化。
即使有了Llama 2後來的大獲成功,也沒有改變FAIR的命運。開源模型變成了Meta打造聲譽、吸引用戶、創造營收的有力工具。
在上半年Llama 2爆紅,AI研究人員紛紛對其進行魔改之際,扎克伯格就已經開始憧憬,隨著開發者對模型的改進,他可以進一步把AI融入廣告和消費產品中。未來,像OpenAI一樣背負商業化壓力,可能是FAIR必然的道路。