DeepSeek爆火的啟示:中國如何耕植創新基因?
「深度求索(DeepSeek)將來怎麼樣不得而知,但它的橫空出世至少告訴世界,中國很多『小角落』能夠爆發出大能量。」在近日由盤古智庫舉辦的研討會上,談及正以破圈之勢引起全球巨震的國產AI大模型DeepSeek時,國證券首席證券首席的文化大師藝術建築知名度,如果經濟大富亞的聲音,提高了中國資本家的主要企業經濟。 “一位外國基金經理告訴我,他們內部從來沒有寫過對中國超過40頁的報告。但因為DeepSeek,他們剛剛完成了60頁的報告。”

春節前夕,中國AI新創公司DeepSeek發布的開源模型DeepSeek-R1,以不到OpenAIGPT-4o模型十分之一的訓練成本,達到與之接近的性能,並實現開源,顛覆了AI行業認知。而這家新創公司成立不過一年多,脫胎於一家以量化交易為主的對沖基金,公司85後創辦人梁文鋒成長於「廣東一個五線城市」、浙大碩士學歷出身,其團隊成員均為本土研究人員。
於是,這典型的中國版「大衛戰勝歌利亞」的故事,引發國內外資本市場、學界和產業界的廣泛討論。國際市場重新檢視中國企業創新實力的同時,國內市場也開始思考金融資本在支持科技創新中的角色,探索DeepSeek的成功能否被複製。
「DeepSeek現象既是偶然,也是必然。我國去年的研發投入比2014年多了2萬多億元,這一規模可能在全球也是從來沒有發生過的,與此同時,企業的主體地位也在逐漸形成。但賦能企業還缺少一些機制,目前的企業委任靠前的企業還是以國務大臣主導,地方還有待創科技。
創新及創新人才的再定義
近期以來,將全球視線吸引到中國市場的主角有二:一是超過ChatGPT成為全球增速最快的AI應用,並以算法集成創新突破算力限制,以開源模式引發“科技平權”討論的DeepSeek;另一個是中國影史首部票房破百億元、進入全球票房榜前11名的電影《鬧吒之海》哪吒之海。
優實資本董事長邢傑表示,DeepSeek掌舵人梁文鋒與魔童哪吒有相似之處。 「梁文鋒就是一個活著的哪吒。他不是『名門正派’,但也『殺出了一條血路』。」。
邢傑解釋說,如果將DeepSeek-R1的推出放回AI產業發展的時間軸上,它的影響力可能比較有限,但DeepSeek的R1恰恰是在從預訓練向推理轉向的大模型第二階段,在國內算力資源受限的情況下,達到與全球頂級大模型
「有時候匱乏反而是財富,正是因為算力的匱乏倒逼了DeepSeek做彙編語言方面的編程,就像以色列資源極度匱乏,但反而極度創新。這是值得國內目前處於弱勢地位的行業和機構思考的。」邢傑說。
邢傑認為,Open AI發表論文說過程性激勵非常重要,其確實也沿著這個思路獲得成功,但閉源之下,業界只能根據其提供的思路往前走;而DeepSeek發現了一件很簡單的事情,就是改過程激勵為結果激勵,通過推理模式的形成能夠以高性價比達成類似性能。
矽谷知名創投人馬克安德森(Marc Andreessen)近期在接受媒體採訪時也提出,這家中國公司想出瞭如何使用更便宜的晶片(獲得高性能),將使用變得更加高效。同時,他們以開源的形式將經驗提供給全世界,為任何想要進行類似工作的人提供了路線圖。
「六個月前,這些還非常深奧、極其昂貴且專有。如今,它變得對每個人來說都是免費且永遠可用的。」馬克安德森說,在美國,很多大型科技公司、互聯網公司和初創公司,要么正在基於DeepSeek進行重建,要么將其整合到他們的產品中,要么研究他們使用的技術,並用它來改進現有的AI系統。
多名國內業界人士認為,DeepSeek的橫空出世,讓市場開始重新定義創新。
DCCI未來智庫與FutureLabs未來實驗室首席專家胡延平認為,DeepSeek的亮點,按實際價值其實依次是強化學習、混合專家模型MoE、知識與模型蒸餾、多頭注意力、多Token預測、混合精度訓練和PTX等,儘管沒有一項是DeepSeekeekyeek2、多頭注意力、多Token預測、混合精度訓練和PTX等,儘管沒有一項是DeepSeekeekyeek 也讓自己提升模型的,但是DeepSeek 成功地進行了提升成為可能。
圖靈新智算創辦人暨董事長劉淼持相近態度。他提出,「在目前AI領域幾乎很難有從0到1的原創了。」OpenAI第一個走出來,利用算力、數據、演算法作出了智能湧現。 DeepSeek則是把每個環節做到極致,達到了高品質、低成本的效果。它的成功證明了,以工程學的路徑達到整個系統最佳化是完全可行的。
而在邢傑看來,DeepSeek的成功,也提示著中國社會和各級組織,需要看到一類「非共識、非主流、非中庸」的創新人才。越前沿的東西可能越是非共識的,這需要從機制上保證,從資源上支持,從文化給予土壤。
一位業內人士對第一財經表示,即便實施開源,國內AI企業短期內也很難成為第二個DeepSeek,其背後的原因就在於很難有企業擁有足夠的自有資金、能力和恆心,專注於純技術。
另一方面,DeepSeek的「免費」和「高性價比」不免令人想起電商界的拼多多。不過,目前,DeepSeek-V3 API服務的優惠價格體驗期已結束,從2月9日開始已調整新的付費價格。
「一個很有趣的現像是,在DeepSeek的API漲價200%-500%區間時,如阿里雲等實施大幅度降價。這種『你漲價我降價』的現象,我稱之為叫AI大模型的內卷以及反內卷。AI大模型領域比任何其他領域都更需要反內卷,如果都沒有賺錢,就變成了許多人的遊戲。
如何影響中國創新路徑?
「DeepSeek以及《哪吒2》的破圈,對中國創新的體制機制、對各方面都是一次觸動。我們必須重新審視市場的力量、基金的力量、場景的力量,以及年輕人的力量和寬鬆環境的力量。總之,DeepSeek的爆火不僅是一次技術突破,更是對創新思維的肯定。」盤古智事說。
梁文鋒成立量化基金幻方量化,曾是熊園的客戶之一。後來,梁文鋒在接受採訪時曾提出,幻方量化在一定程度上增強了該團隊對技術驅動創新的信心,這促使其後來成立了純技術公司DeepSeek。
Aletheia Capital中國策略分析師陳昌華近日撰文提出,這次突破來自以量化交易為主的對沖基金,或許會讓人理解金融和其他服務業對經濟和科技進步的貢獻。一個現代經濟體要健康發展,需要多個產業協同進步,而一個企業最原始的訴求就是提供消費者需求。
也有業界觀點認為,DeepSeek讓人們對於中國在什麼地方,以什麼體系,可以培植出如DeepSeek一般的現象級創新,產生思考。
身為中國第一批網路連續創業家中的一員,近一段時間以來,英諾創新空間創始合夥人、清華校友總會網路與新媒體專委會秘書長鄧永強經常面對三個問題:梁文鋒為何來自於浙大而非清華(全國資訊工程排名第一)?這家年輕的大模型公司為何在杭州而非其他城市?站在投資人的角度,如何看待VC們集體錯過DeepSeek的現象?
另一個值得關注的問題是:為何這種創新沒有出現在科研院所、網路大廠或科技巨頭公司?
「國家戰略引領下的一些大院、大所以及相當多由地方政府合資成立的新型研發機構,他們過去在基礎研究上,包括在解決一些卡脖子問題上,形成了一種比較主流的技術創新體系。但以DeepSeek為代表的創新,是非常市場化的,是在一個市場空白點上實現的重大突破。」人文財經朋友發起突破。秦世說。
張旭認為,對於未來的科技體制改革框架,應該有兩個轉變:第一個是從「跟隨」到「原創」的轉變。原創不見得是基礎研究。另外目前科技創新的人才激勵與評價體系還有一些待改進的地方,需要把機會給予更多年輕人;第二,儘管目前企業的創新主體地位越來越明顯,但政策還不夠配套。例如科研經費需要進一步轉移到企業主體。
從城市維度來看,盤古智庫學術委員會副主任委員梁春曉表示,杭州與成都兩座城市有個共通性特徵,就是親近小微,柔性治理。所以,這兩座城市聚集了許多的小微型企業,能夠產生震驚中國和世界的成績並非偶然。
以電子資訊產業密集的深圳為例,一名接近當地政府的人士提出反思:第一,杭州的創新是以軟體和阿里生態為核心,而深圳儘管在十幾年前開始就注重原創和教育基礎設施培養,但遠水解不了近渴;第二,近五到十年裡,深圳太專注於大企業,但遠水解不了近渴;第二,近五到十年裡,深圳太專注於大企業,但部分大企業的創新
「目前,地方政府已經注意到了這些創新問題,預計近月內會有政策出台。」前述人士說。