OpenAI向左,Meta往右
OpenAI正變得越來越封閉,但它的對手Meta(前Facebook),卻透過開源贏得不少讚譽。1月18日,馬克·祖克柏宣布,Meta正在計劃建構自己的AGI(通用人工智慧),將在絕大多數領域中都達到或超越人類智慧水準。同時他強調,保證會向大眾開放這項技術,讓人人都能從中獲益。
與OpenAI拒絕Open他們的演算法、路線、論文相反,Meta選擇Open到底。先前震驚業內的大模型LLaMA,大獲好評的LLaMA 2,以及正在研發的LLaMA 3,都是開源的。它們成為許多AI公司研究、學習甚至抄襲的對象。
透過開源這項手段,Meta在某種程度上打破了大模型的壟斷,成為OpenAI和Google雙雄相爭之外的第三股力量。有些人將祖克柏視為大模型時代的英雄,有人在祖克柏的貼文下留言,建議Meta更名為OpenAI,OpenAI更名為CloseAI。
事實上,Meta過去開源了它研發的幾乎所有基礎設施,例如用於Web和APP開發框架的React,以及機器學習框架PyTorch,而ChatGPT就是基於PyTorch開發的,OpenAI也運行在PyTorch上。按照Meta首席科學家楊立昆的話說,除Google外,全世界都運行在PyTorch上,因為Google有自己的系統。
只是,這些東西在過去都被Meta的負面新聞掩蓋了——幹預選舉進程、提供虛假信息、危害青少年健康,在矽谷,罵Facebook曾是一種“政治正確”, 人們認為這是一家價值觀敗壞的公司。
如今風評大變,Meta一時彷彿成了整個AI圈的希望,它的股價在2023年上漲了160%,在美國前五大科技巨頭中漲幅僅次於英偉達,最近重返萬億美元市值,股價創新高。而曾以挑戰者姿態崛起的OpenAI,前不久剛經歷了一場宮鬥,散發出越來越濃的銅臭味。
OpenAI向左,Meta往右,兩家原本沒有太多交集的公司,正走出截然不同的路。
OpenAI,走向封閉
在討論這兩家公司的境況之前,我們先把時間拉回十年前。
2013年,有一家叫DeepMind的AI公司,同時引起了Google和Facebook(當時還沒更名為Meta)的注意。
當時這家公司剛嶄露頭角,嗅覺敏銳的Google和Facebook都想收購它。最終,Google在競購中勝出,2014年1月將DeepMind收入囊中。三年後,DeepMind開發的AI機器人AlphaGo,以4:1擊敗了韓國圍棋冠軍李世石,一舉成名。
Google收購DeepMind時,有兩個人心裡很不是滋味。一個是祖克柏,他當時已經意識到AI的巨大前景;另一個是馬斯克,他不想AI被Google這樣的大公司控制。
於是,祖克柏決定自己做,他花重金從紐約大學邀請了電腦科學領域的權威人物楊立昆,啟動FAIR項目,在Facebook成立了AI實驗室。馬斯克則和奧爾特曼成立了OpenAI,用來對抗Google。
從當時的情形來看,祖克柏是為了自己的公司,馬斯克是為了全人類。馬斯克認為,由大公司控制的少量AI系統很不安全,唯一的辦法是讓盡可能多的人都擁有AI。所以OpenAI一開始就定位開源,是一個非營利的機構。
馬斯克當時說:“我們希望有一種類似於Linux版本的AI,不受任何個人或公司的控制。”
一個為私,一個為公,兩家公司一開始就選了不同的路。
馬斯克提到的Linux,是一款免費開源的作業系統。在網路早期,電腦剛開始普及時,可用的作業系統不多,要嘛原始碼被軟體廠商嚴格保密,要嘛收取很高昂的費用。一個歐洲大學生開發Linux操作系統的雛形,然後免費對外公開了自己的程式碼。
由於開源,全球程式設計師都加入來改進程式碼,最終創造了Linux作業系統,且使用完全免費。這大大加速了電腦的普及。我們今天熟知的Android系統,就是基於Linux內核,全球大部分手機都跑在這個系統上。
馬斯克的想法很簡單,AI時代也需要有這樣一個開源開放的作業系統,市場不能讓巨頭獨佔。
OpenAI的啟動資金來自一群科技大佬捐贈,它一開始的確是按開源的路徑走的,2019年發布的GPT-2,就是一個開源大模型,當年還有人用GPT-2為《權利的遊戲》改寫劇本結尾。
但也是在GPT-2發布之後,OpenAI逐漸走向封閉。它隨後成立營利子公司,接受了微軟的數十億美元投資。
在那之後,2020年發布的GPT-3,2022年升級的GPT-3.5,以及2023年3月發布的GPT-4,都是閉源模型,一開始OpenAI還公佈論文,到後來連模型具體參數都不再公佈。
而從整個大模型產業的競爭格局來看,「OpenAI-微軟」「DeepMind-Google」的雙巨頭組合格局正式形成。
馬斯克對此非常不滿。他說,OpenAI設立時是一家開源公司,現在變成了一個閉源、受微軟控制的逐利公司。這根本不是他想要的。
這段期間Meta沒閒著。除了折騰元宇宙,Meta的AI團隊一直在研究大語言模型,並發布了一些開源專案。大家各做各的,互不干涉。
在OpenAI發布ChatGPT的幾週前,Meta發布了一個類似的聊天機器人Galactica,專門用於撰寫科學論文。誰知道這個產品不但沒引起轟動,還招來一片罵聲,網友痛斥它會破壞科學出版。以至於Meta的人取消了演示,覺都睡不著。
當時人們關心的是Meta的元宇宙計畫是不是快涼了,裁員裁到哪了,沒人關心它的AI做得咋樣。至於OpenAI,大家覺得它代表新勢力,對它更包容。
根據楊立昆的說法,兩週後ChatGPT問世,被視為救世主降臨。隨後很久的時間裡,OpenAI都是全球科技界的當紅炸子雞,登上神壇奪走了所有目光。人們津津樂道於,OpenAI是如何衝破Google的封鎖,對巨頭形成壓制。
在崇尚個人英雄主義的美國,創業新秀挑戰舊勢力的劇本,向來充滿話題性。於是大模型頭部選手的競爭,變成了OpenAI和Google的雙雄爭霸。
但一向好強的祖克柏不會袖手旁觀。Meta秘密研發的LLaMA大模型,已經箭在弦上。
Meta才是全村的希望?
2023年2月,ChatGPT發布之後3個月,LLaMA的第一個版本開源,一開始這個模型只能用來當研究。7月,升級後的LLaMA 2支援免費商用。Meta把模型訓練資料、訓練方法、資料標註等大量細節都公佈了,起始程式碼全部開源。
LLaMA 2性能非常突出,超過了所有的開源大模型。有人發現,其最大參數的版本比GPT-3參數量小,但效果更好。
曾經跟著馬斯克從OpenAI跳到特斯拉,後來又被OpenAI挖回去的科學家Andrej Karpathy,將LLaMA 2的發布視為人工智慧和大模型發展過程中的重要一天,因為這「是任何人都可以拿到模型權重的最強大語言模型。”
一時間,整個AI圈對Meta刮目相看。當一群巨頭公司掀起大模型軍備競賽,試圖透過技術封閉來實現市場壟斷時,Meta用LLaMA撕開了一條口子。OpenAI沒做的事,Meta做到了。
英諾天使基金合夥人王晟戲稱楊立昆為「Klaus LeCun」(楊立昆英文名為Yann LeCun,Klaus Fuchs在二戰期間向蘇聯提供了曼哈頓計畫的資訊)。王晟開玩笑:“不能只讓美國擁有原子彈。”
王晟發現,ChatGPT出現之後,科技圈對大模型熱情且迷惘。投資人中很多是看熱鬧,“因為第一看不懂,第二不敢投,第三投不到。一個新的技術範式出現,沒人知道它的能力邊界在哪裡。”
王晟對「定焦」說,LLaMA開源對產業影響很大。“Meta過去這些年積累的大模型技術,本來都是不傳之秘,結果一開源,迅速把很多認知拉平了。”
之前,國內團隊研發大模型,只能從零到一不斷試錯,一旦有個點被卡住了,即便從技術角度來說並不是太難,但靠自己可能也需要花一兩年時間才能解決,需要親自踩很多坑。現在Meta直接把它的經驗和數據拿出來,在思維和方法上給了業界非常重要的指引。
「在這個過程中大家學習了很多。假如沒有LLAMA開源,國內大模型今天的水平可能會差很多,我們會大幅度被人甩下。」王晟說。
這也是為什麼國內一下子突然湧現200多個大模型。王小川的百川智能在公司成立僅兩個月就發布了一款大模型,其實就是藉鏡了LLaMA。李開復的零一萬物推出的大模型,也是使用LLaMA的開源模型架構。
LLaMA開源對OpenAI最直觀的影響,是有一堆中國公司跳出來「吊打」GPT。在他們的口徑中,已經在多項指標上超過了GPT模型,雖然很多榜單都是刷出來的。
更深層的影響在於,大模型開源社群的力量快速壯大,全球的程式設計師都能為開源做出貢獻。他們開發出各種開源資料集,迭代出更多新模型,縮小與閉源大模型的差距。所以Google的工程師說,Google沒有護城河,OpenAI也沒有。
Meta在科技圈的形象變得高大起來。回顧Meta的發展,其實它一直都有開源的傳統。
早在2016年,Meta團隊就開發並開源了深度學習框架PyTorch,它和Google的TensorFlow成為深度學習領域的兩大主流框架。
跟OpenAI現在才開始秘密推進晶片製造專案不同,Meta在三年前就設計了自研AI推理晶片,並採用了開源架構。
在語言翻譯方面它推出了許多開源模型,兩年前發布的NLLB模型是維基百科的翻譯供應商之一,2023年發布的SeamlessM4T可以翻譯近百種語言,同時它也發布了全球最大的開放多模態翻譯資料集。
有研究人員經過對比認為,Meta更傾向於信任、問責制以及透過開源來實現人工智慧的民主化。
反觀OpenAI,它依然在技術上保持領先,但拒絕開放。
「沒人知道OpenAI進展到什麼程度了,包括它正在研發的GPT-5,是不是繼續用的transformer都是未知數。現在大家都跟著GPT-3.5的技術路線在跑,假設它悄悄變換了方向,那大家就掉坑裡了。因為沒人知道正確路線是什麼。」一位AI公司的創辦人說。
同時它試圖阻擋競爭對手,以保持自己的先發優勢。
位元組跳動在2023年12月被OpenAI停用帳戶,因為它在呼叫OpenAI的API開發自身大語言模型的時候,違反了OpenAI的服務條款。違反商業倫理的行為肯定是不對的,但外界由此關注到OpenAI的商業條款,它禁止客戶使用GPT輸出的內容開發任何可能會給OpenAI帶來競爭的AI模型。
值得注意的是,微軟也有類似條款。它們將商業上的競爭優勢看得很重要。
人工智慧公司開放傳神(OpenCSG)創辦人、CEO陳冉認為,開源的市場空間遠比閉源大,但未來一定是開源和閉源兩條路同時走,「OpenAI開源其實不重要了。 」
開源閉源,誰對誰錯?
究竟是OpenAI被利益蒙蔽了雙眼,還是Meta大公無私要為全人類做出貢獻?
或許,它們在本質上並無不同。OpenAI既沒有那麼自私,Meta也不像網友鼓吹的那麼高尚,差別只在於路線和策略。
若論對整個AI產業的貢獻,OpenAI毫無疑問是最大的。畢竟,這一輪AI浪潮是由ChatGPT掀起的。它點燃了一把火,加速了大模型的普及。事實上,前兩年大模型開源社群基本上是圍著GPT-3在轉。
OpenAI不像Google、Meta那些巨頭擁有雄厚的資金積累,早年大佬捐贈的資金早花得差不多了,沒錢是做不了研發的,總不能用愛發電。所以OpenAI抱了微軟的大腿,奧特曼想盡辦法為OpenAI賺錢。
陳冉認為,OpenAI的成功其實是商業模式的成功,本質是投資人看到了巨大的商業價值和獲利模式。開源與閉源之間的競爭方向一定是賺錢模式的創新競爭。
Meta將科技開源,也不只為他人做嫁衣。開源是一種策略,能吸引更多開發人員免費幫它迭代技術、修復漏洞,正所謂眾人拾柴火焰高,但最核心的技術還是掌握在Meta手裡,該打擊對手的時候它不會手軟。就像Google,它旗下的Android是開源系統,但國內手機廠商做自己的系統還是會有很多限制。
而在大模型火起來之前,Meta掉進了元宇宙的深坑裡無法自拔,砸錢、虧損、裁員,看不到任何希望。大模型是那根救命稻草,ChatGPT則是照亮前路的那束光。
再往深了看,閉源的OpenAI和開源的Meta,從根本上對AI的價值判斷有分歧。
如果將AI比喻為未來世界的核武器,OpenAI認為它很危險,得謹慎,不能濫用。Meta則認為,核武不能只掌握在少數幾個玩家手裡,應該開放研究。
關於AI的利弊之辯,是科技圈的老話題。馬斯克就相信“AI危險論”,他擔心有一天機器的智力、意識都超過了人類,可能會取代人類,摧毀人類文明。所以他當年牽頭成立OpenAI,只是後來OpenAI沒照他設想的路徑走。
基於「防止AI取代人類」的願景,業界又延伸出兩大派別。一派認為大量獨立的AI系統比由大公司控制的少量AI系統更安全,AI的研究應該開源開放;另一派認為應該封閉研究,這可以減輕安全風險,防止不法分子濫用獲得的代碼。
OpenAI屬於後者。支持它的人認為開源策略加大了風險,比如倫敦一家AI公司的CEO就認為,Meta是最不負責任的人工智能參與者,他問:“我們應該令核武器的設計透明化嗎?”
Meta將開源視為最優策略,楊立昆就認為,機器最終會比人類更聰明,人類無法阻止壞人獲取它,AI必須是開源的,只有讓更多人參與其中,最終開發出的系統才會更安全。他認為馬斯克的AI威脅論就是科幻小說看太多了。
楊立昆曾經的合作夥伴,跟他一塊獲得圖靈獎的傑弗裡·辛頓,則持有不同觀點,認為AI將對人類構成嚴重威脅。他的思想也許對他的學生伊利亞造成了影響。伊利亞是OpenAI的共同創辦人兼首席科學家,幾乎決定了OpenAI的技術路線,他也是OpenAI宮鬥事件中開除奧爾特曼的關鍵人物。伊利亞一直致力於追求安全可靠的AGI。業界普遍認為,商業化和AGI的路線之爭,引發了那場衝突。
所以,OpenAI和Meta有不同的信念。OpenAI將AGI視為終極目標,並且相信自己將會第一個實現它;Meta將開放平台視為最好的路徑,試圖制定開源標準。當然,它們都希望在這個過程中拿到應得的商業利益。
往長遠看,AI的發展是螺旋式上升的,開源也好,閉源也罷,都將為其註入動能。究竟誰真的在為全人類的未來操心,只有等待時間檢驗了。