免費還能幹翻GPT-4 Meta打了所有閉源大廠的臉

2024-04-20 Comments 0 Comment

不知道李彥宏現在心情如何。就在他公開表示「開源模式會越來越落後」的3 天后，活菩薩小扎慢悠悠地登場了。絲毫不給面子，以一己之力掀翻了桌子。

就在今天凌晨， Meta 正式發布了全新的Llama 3 模型，也一次上新了8B 和70B 兩個參數版本。

它的訓練資料集比Llama 2 整整大了7 倍，達到了15T ，容量也是上一代的兩倍，支援8K 上下文長度。

目前，它們已經連接了Meta 最新發布的智慧助理Meta AI 中，所有人都可以免費使用。

這兩個模型同樣全面開源，開發者可以免費下載，並且用於商用。（不過要注意的是，如果MAU 超過7 億，你得申請特殊商業許可）

小札這是誓死要在開源這條路上，一條道走到黑了。

當然更炸裂的是Llama 3 的實力除了穩居開源大模型榜首外，甚至還能在一定程度上，薄紗Gemini Pro 1.5 、 Claude 3 Sonnet 等處於第一梯隊的閉源大模型。

有網友更新了一份現有大模型的能力和參數對應表，能看到Llama 3 的兩個模型的表現都相當亮眼。

這，可以說是給大模型的開源派大漲了一波士氣。

反正消息一出爐，開源社區立刻就沸騰了，各種梗圖滿天飛，感謝著小札又帶兄弟們衝了一次。

不過，世超覺得既然模型已經上線了，看再多的技術細節和跑分數據，都不如咱們親自上手試試。

稍微有點可惜的是，目前發出的這兩個版本，還沒有辦法支援中文輸出。

也暫時只有文字對話和畫圖這兩個簡單的功能。在各家多模態打磨得出神入化的現在，多少有點OUT 了。

不過好在這次Meta 的圖片輸出，有一個挺新奇的功能。我們在聊天框裡輸入文字，不需要發送， Llama 3 就會即時根據內容產生影像。

例如我分幾次在對話框輸入了【一隻貓在睡覺、跳舞和跳躍】，就能看到螢幕上生成的圖片內容在跟著即時變化。

到了文字輸出這邊，驚喜度就不高了。

既然它在測試中，說自己在程式設計、多選題等等方面，都趕超Claude 3 的中型版本，咱也著重測了測這方面的虛實。

世超測了很多題，這裡就只放出兩邊有差別的地方。

例如簡單的邏輯推理：我今天有3 個蘋果，昨天吃了一個，今天還剩幾個？

Llama 3 完全沒有壓力，輕鬆駕馭。

但同樣的題目拋給Claude 3 ，卻被完全繞進去了。

不過，後面世超後面簡單測了幾道程式碼能力，反而Claude 3 的表現更讓人驚艷。

世超要Llama 3 為我做兩個簡單的html 小遊戲。

結果，做出的貪吃蛇和打磚塊遊戲，都沒有辦法正常運作。遊戲還沒開始，就顯示Game Over 了。

但Claude 3 這邊做的，雖說有點小瑕疵，遊戲重新開始之後，分數不會刷新。但除此之外都很完美，遊戲能有正常運作。

而且生成速度巨快，幾秒鐘就做出來。上一次見到這個速度的，還是GPT-4 。

而後面的開放題， Llama 3 則馬上扳回了一城。

世超給了一個開放性的問題：類人機器人的未來會是什麼樣子？

幾個字的小問題， Llama 3 依照短期、中期和遠期，三個階段來分點構思了一下可能性。

由於篇幅限制，這裡只截取了短期

Claude 3 這邊就有些中規中矩了，跟上面分時間、分點羅列的優等生比，遜色不少。

整體測試下來，Llama 3 和閉源的Claude 3 基本上打得有來有回，甚至一些方面小勝。

但如果只能做到這個程度， Meta 這次更新根本無法在圈子裡掀起這麼大風浪。

這兩個模型並不是重頭戲，真正牛叉的地方，是官網裡提到的一個訊息：400B+ 參數級的Llama 3 正在訓練準備中了。

從紙面的各項數據來看，它各方面都強得可怕。

Llama 的產品副總裁Ragavan Srinivasan 在一次採訪中說，這個版本可以媲美同類的一流專業模型。

不僅做到媲美，很多功能表現，還要強過Claude 3 的超大杯版本和GPT-4 。

雖說Meta 認為還要評估安全性，再決定開不開源，但消息一出，業界早已經開始狂歡了。

因為開源社群的人，或許不用等OpenAI 重拾初心，就能到調教、魔改上GPT-4 等級的模型了。

英偉達科學家直接就發文說，小扎這個400B+ 的模型，將會是產業的一個分水嶺，會改變很多公司和研究的未來。

剛好今天過生日的前百度首席科學家、Google大腦之父吳恩達，也說Meta 這次更新，是他有史以來收到過最好的生日禮物。

可想而知， Llama 3 為業界帶來的震撼。

目前，這個400B+ 的終極版本預計將在夏天發布。

OpenAI 再不發力，Llama 3 為代表的開源大模型，徹底超車閉源大模型的歷史時刻，可能真的就要來臨了。

而早在Llama 3 發布之前，大模型是開源牛，還是閉源好的問題，其實早就吵得不可開交了。

兩邊陣營都不缺大佬，李彥宏所說的，「開源模型會越來越落後」，世超覺得邏輯上是很自洽的。

因為閉源公司有成熟的商業模式，有更多的資金和人力砸進去搞研究，自己辛苦研發的成果，也可以受到保護。簡而言之就是能賺錢，能賺錢才能聚集算力、聚集人才。

反觀很多開源模型，不僅商業模式還在探索中，有的也都是零零散散的小規模產品。

月之暗面的楊植麟就曾發表過類似的觀點，說是大部分基於開源大模型的應用，沒有經過大算力的驗證，它們在性能的穩定性、未來的可擴展性都不好說。

而支持開源的這一派，世超同樣也覺得不無道理。朱嘯虎曾經表達過一個看法，閉源現在確實領先於開源，但開源模型最終會追上。

“OpenAI 就一兩百個工程師，開源的全世界幾百萬、幾千萬工程師在用，怎麼可能一直比非開源的落後？ ”

開源社群花了一年時間，就超過了GPT-3.5 ，現在已經來到GPT-4 程度。而現在Llama 3 等模型的大力追趕，正在不斷驗證這句話。

比爾蓋茲早年間，曾經公開吐槽過Linux 系統。覺得它從商業上來看根本不可行，既不能保護自己的智慧財產權，又沒辦法賺取收入來搞研發，最多就是個半吊子。

《賈伯斯傳》中也提到過，賈伯斯也怒噴過隔壁Android ，認為它的開源給它帶來各種麻煩。

最後這兩個超級大佬都被打臉了……甚至連比爾蓋茲後來公開承認微軟在偷學Linux ，Android也絲毫不比iOS 差。

而世超覺得，很可能大模型的開源閉源之間，根本就不是你死我活、不是誰強誰就一定弱。

就比如Google，基本上就是兩手抓，既有閉源的Gemini ，也有開源的Gemma 。曾經靠開源出圈的Mistral 拿了微軟投資之後，它的Mistral Large 也不再對外開源。

所以開源和閉源很可能只是路線之別，哪有啥對錯，只是有合適與否。

而唯一能確定就是，甭管你是開源還是閉源，燒錢都是逃不開的，無論是OpenAI 背後的微軟，還是Llama 背後的Meta ，亦或是國內的BAT ，大模型的戰場還是這幫頂級資本之間的鬥爭。

咱們就搬好小板凳，磕著瓜子繼續吃瓜吧。

來源：差評

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

WONGCW 網誌

記錄生活經驗與點滴

免費還能幹翻GPT-4 Meta打了所有閉源大廠的臉

2024-04-20 Comments 0 Comment

相關

發表迴響取消回覆

分享此文：

相關

發表迴響取消回覆