DeepSeek開源週才隔天有些公司就已經坐不住了
今天的AI 圈可以說是格外熱鬧了。真正「Open」 的DeepSeek ,打出開源週的第二發砲彈,短短幾個小時就已經在GitHub 上,收穫了3k 多星。「 開源老兵」阿里通義千問也沒閒著,推出了QwQ-Max-Preview 深度思考模型,展示思維鏈,還支援連網搜尋。
今天的AI 圈可以說是格外熱鬧了。真正「Open」 的DeepSeek ,打出開源週的第二發砲彈,短短幾個小時就已經在GitHub 上,收穫了3k 多星。
「 開源老兵」阿里通義千問也沒閒著,推出了QwQ-Max-Preview 深度思考模型,展示思維鏈,還支援連網搜尋。
還有凌晨兩點多,大夥兒可能還在做夢的時候,大洋彼岸的Anthropic 也給模型升級換代了。號稱他們迄今為止最聰明的Claude 3.7 Sonnet ,還是個推理模型和傳統模型的「 混血」 。

我估計今天那些專門做模型評量的博主,都快要忙不過來了吧。 。 。
再加上Grok 3 、 DeepSeek R1 、 o3 mini ,世超猜到了今年推理模型必有一戰,但沒想到,來得這麼快。
光這麼說大夥兒估計也沒感受,今天咱們就挨個來看看, AI 圈子到底是怎麼個熱鬧法。
先把視線,放在新一代「 開源戰神」 DeepSeek 身上。
在用R1 教育了一遍市場之後, DeepSeek 這兩天,乾脆開源了個徹底, 5 天時間,每天發一個代碼庫。
第一天,整了個FlashMLA ,這玩意兒專門針對英偉達的Hoppers GPU ( 例如H100 、 H800 ),進行了效率優化,通俗點說就是榨乾GPU 的最後一滴效能。

今天開源的,則是DeepEP 通訊庫。
根據官方的介紹,這是一個專門為專家混合( MoE )和專家並行( EP )設計的通訊庫。太複雜的咱也不去深究,大白話就是通訊庫可以讓「 專家們」 的溝通更快速、更有效率。
盲猜一波,國內那些個手上有Hoppers GPU ,還是研究MOE 模型的AI 公司,可能已經衝了。
不知道明天DeepSeek 又會開源哪個程式碼庫,但光憑他們這敞開、真誠的態度,圈粉就是分分鐘的事兒,在DeepSeek 的評論區底下,世超已經看到不只一位老哥,對著OpenAI 貼臉開大了。

不過說到這,可能會有差友疑惑,網路上整天嚷嚷著開源,這跟咱到底有啥關係?
這麼說吧, DeepSeek R1 開源以後,大大小小的私企、國企都吻了上來,還有高校甚至政府機關,不是已經接入DeepSeek ,就是在接入的路上。
經過大規模的模式部署後,下一步就是生態的建構、產業的融合,就像當年的「 互聯網+」 , AI 同樣也可以成為基礎設施,融入到咱們生活的方方面面。
很難說,閉源模型在建構生態這一步,能不能在短時間內達到像DeepSeek 這樣的效果。
所以這一切,我們可能都得感謝開源。

再來看阿里通義千問的QwQ-Max-Preview ,是推理模型。阿里也算是國內第一個,推出推理模型的頭部大廠。
根據官方的說法,這是一個基於Qwen2.5-Max 的推理模型,有很強的數學理解、編碼能力,但目前還只是預覽版。
世超在第一時間簡單試了試, QwQ 也有思維鏈的展現。 (不得不說,QwQ這名字有點可愛。。)

問它一道數學競賽真題,最後的答案倒是對了,就是思考時間稍微久了些,我粗略估計思考了得有兩分鐘出頭。

這題問DeepSeek R1 ,它的思考過程跟QwQ 很相似,也是分析了多種可能性,但R1 勝在推理的速度稍微快一些( 112 秒)。
而同樣的題目,我又問了今天的另外一位主角Claude 3.7 Sonnet 。
只能說,又快又準。

但值得注意的是, Claude 3.7 Sonnet 是個混合模型,一個模型有標準和擴展兩種模式。
如果你想看到大模型的推理步驟、思考過程,那就得選擴展模式。

如大夥兒所見,體驗Claude 3.7 Sonnet 的推理能力,是另外的價格。

世超還找了幾個外網的實測案例,發現Claude 的程式碼能力依然強得可怕。
同一組提示詞餵給Claude 3.7 Sonnet 和Grok 3 ,這是Claude 3.7 Sonnet 的結果。

再來看Grok 3 的,直接被碾壓。

即使DeepSeek 加入戰鬥,也被秒了。 。 。

反正看下來, AI 發展到今天,已經有點超乎世超的想像了。
雖說今天這三則新聞放一起,打眼一看,好像沒啥特別大的關聯。
但稍微一提煉就會發現,它們恰好體現了當前人工智慧發展的趨勢:開源陣營不斷壯大,推理模型成為主流。
模型的開源和閉源之爭, DeepSeek 一出手,即便是奧特曼,也不得不親口承認, OpenAI 的閉源策略“ 站在了歷史錯誤的一邊” 。

像Llama 家族這種具有里程碑意義的模型,對於開源社群的重要性無需多言。
而除了DeepSeek 和Meta ,阿里通義千問、 xAI ,還有陸續擁抱開源的百度、 Minimax 和階躍星辰,開源陣營肉眼可見在壯大。
另外一邊,前兩年大模型是不是老強調自己的長文本能力,慢慢的開始卷文生圖、文生視頻還有語音交互這些多模態,再到最近,模型跑分全是數學、代碼。
真就應了那句話,AI 一天,人間一年。
照這麼下去,可能哪天OpenAI 宣布開源,又或者誰家突然宣布把AGI 整出來了,我都不會覺得驚訝了。