DeepSeek真正成為了一條鯰魚
自走紅之初,DeepSeek就因成本優勢不斷震驚業界,為其開源生態發展奠定了非常好的基礎。過去大模型走閉源路線與成本息息相關。許多大模型在預訓練階段幾乎都選擇了不計成本地投入,而DeepSeek選擇劍走偏鋒,把重點放在了上崗之後的強化學習。用反覆高強度地訓練,倒逼自身不斷地調整姿勢,理解邏輯,自我反思,直到結果令人滿意。

以一直在難產的OpenAI GPT-5為例,估算顯示,該計畫一次為期半年的訓練,光計算成本就高達約5億美元。目前,該計畫已開發超過18個月,成本花費龐大,卻仍未取得預期成果。
這給國內很多大模型公司都敲響了警鐘,意味著想訓練頂級的模型,單是GPU的採購成本就高達幾十億,部署十萬卡集群的「燒錢」程度更是難以想像。
相較之下,DeepSeek找到了一條低算力,高效率的路徑,其訓練成本只是OpenAI相關模型的十幾甚至幾十分之一。
DeepSeek也狠狠回擊了所謂「開源是矽谷精神」的論調,其不僅開源了所有的模型和論文,供所有人去免費下載,還公開了訓練方法,允許大家去做數據的蒸餾,去訓練自家的模型。
這意味著全球所有相關的技術人員,都能在現有的能力基礎上,去做研發與開發,至此,新的技術,新的應用就會在這個新生態產生。
DeepSeek在2025年1月20日發表R1模型後,僅7天新增用戶1億(含網頁端與應用端),成為史上最快破億的AI應用。至2月1日,其每日活躍用戶(DAU)突破3,000萬大關,超越豆包(1,695萬),直逼ChatGPT的5,323萬。
從雲端服務商、電信業者,到多數手機、汽車廠商,越來越多企業正在奮力擁抱DeepSeek。
這條鯰魚很快也攪動了全球AI市場,兩大「AI巨頭」先後決定一改閉源態度,鬆口向公眾免費。
先是1月31日,OpenAI上線了新的推理模型o3-mini,並進一步下放了免費的權限。 OpenAI CEO Sam Altman首次承認在開源上的錯誤,指出後續可能找到不同的開源策略,並有望重拾模型開源。
最新消息則來自於百度,2月13宣布,從4月1日起,文心一言將全面免費。同時即日起,文心一言上線深度搜尋功能;此功能也將於4月1日起免費開放使用。

要知道,去年李彥宏還是堅定的閉源擁躉。 「今天不管是在中國也好、美國也好,最強的基礎模型都是閉源的。閉源是有真正商業模式的,是能夠賺到錢的,能賺到錢才能聚集算力、聚集人才」。
僅僅不到一年過去,情況就開始逆轉。
2開源的底氣到底是什麼?
其實許多人仍對DeepSeek如何算得又快又好抱有好奇,其中比較重要的一點,就是它實現了晶片最底層的優化。 DeepSeek在其發布的技術論文中表示,DeepSeek採用了PTX(Parallel Thread Execution)編程,透過客製化PTX優化,讓DeepSeek的系統和模型可以更好釋放底層硬體的效能。
相較於外界盛傳的算力限制讓其尋找性價比方案,DeepSeek其實是主動擁抱的優化,用PTX把某些SM(GPU裡負責計算的核)做了編程,讓他們來負責做頸的傳輸,使得多個GPU之間的數據傳輸的速度變快,解決了大模型計算中的大瓶計算了同時,它運行了PTX1十分重要的角色。
除了晶片優化,DeepSeek在訓練方法上也下了真功夫。不同於傳統的大模型訓練方法,它選擇直接跳過監督微調階段,專注於透過規則驅動的強化學習訓練推理模型。
從DeepSeek V3 Base的預訓練模型開始,完全省略了監督微調階段,為了實現大規模的強化學習,研究團隊使用了一種名為GRPO(群體相對策略優化)的方法。有人用現實生活生動類比了這一數學原理的精妙之處,「通俗的說,就是一群學生在解決一個問題。老師不再單獨給每個學生打分,而是讓學生自己比較答案。答案更好的學生會受到鼓勵,而其他人則會從錯誤中吸取教訓。隨著時間的推移,整個團隊會共同進步,變得更加準確和一致」。
觀察DeepSeek這一本土化大模型的發展路徑,晶片優化與GRPO,可謂是兩大法寶,提供源源不絕的光照與養分,但光有養分還不夠,一個好的土壤更重要。 DeepSeek的全資母公司幻方量化,原本對AI押寶許久,同時也是國內少數破千億的量化私募,既不缺錢也沒有融資需求。跟國內絕大多數AI相比,DeepSeek在商業化上可以說完全佛系,內部甚至沒有設立過多的營銷、產品職位。
同時,根據公開資訊顯示,DeepSeek研發團隊有139人,均是立足於本土的年輕團隊,他們更知道這片土地到底需要什麼,所以以上這些快速迭代,前沿的實驗成果才有了茁壯成長的土壤。
工程上精益求精,技術上大刀闊斧進行創新,DeepSeek的爆火絕非偶然。事實上,六年前這場佈局就已經開始。它的母公司幻方量化早在2019年就花費2億打造螢火一號超算集群, 2022年默默地屯了萬張A100顯卡,是ChatGPT 3.5發布之後第一波手握萬卡入場券的少數模型公司,積累下的豐富資源增強了開疆拓土的信心。
至此,他們在V3實現了震撼的性價比,R1在實現性價比的同時還跑通了影響很大的新範式,一躍成為AI領域的新星,甚至有些觀點認為,DeepSeek可以稱為中國AI大模型的ChatGPT時刻。對產業而言,DeepSeek的案例再次證明:在AI競賽中,垂直突破、開放式協作、長期主義仍是贏得競爭的關鍵。
3全球資本重估中國科技企業
DeepSeek掀起的人工智慧革命浪潮也改變了中國科技企業的估值敘事。
截至2025年2月12日,恆生科技指數ETF近1週累計上漲7.67%。 2月13日,恆生指數再度高開0.46%,恆生科技指數漲0.77%。嗶哩嗶哩-W、網易-S、百度集團-SW、中芯國際等漲超2%。
根據中國證券報道,高盛日前發布報告稱,中國人工智慧(AI)企業深度求索(DeepSeek)的出現正激發投資者加速購買中國股票的熱情。同時,高盛維持對明晟(MSCI)中國指數的超配評級,預計今年將上漲14%。
在此之前,中國科技企業一直普遍處於被低估的狀態中。大摩的一篇報告指出,全球投資人對中國科技企業的估值體系仍停留在傳統網路思維,未能充分反映其在前沿科技領域的突破。以騰訊、阿里為例,二者港股本益比分別只有19、15,遠低於美股科技股的本益比。
現在,DeepSeek真正成為了一條鯰魚。
美國針對DeepSeek的報道裡,有一個高頻詞彙經常出現:“Sputnik Moment”,又名斯普特尼克時刻(該術語源於1957年10月4日蘇聯成功發射的“斯普特尼克1號”人造衛星。這是人類歷史上第一顆人造地球衛星,它的發射成功使蘇聯在太空領域取得了領先地位,讓美國意識到自己在科技方面落後的科技感,尤其是給美國帶來了領先地位,讓美國的科技落後
這件事對當時的美國衝擊很大,隨後1958年NASA成立,美國舉全國之力完成了登月,重新回到太空領域裡面領先的地位,才拔掉了自己心頭的這根刺。而這次,在美國最核心的AI領域裡,DeepSeek又插進去了一根新的刺。