登上新聞聯播的DeepSeek震撼美國5000億美元要白花了嗎?
最近一周,中國的神秘AI公司、被稱為「AI界拼多多」的人工智慧新創公司深度求索(DeepSeek)刷屏全球各大主流媒體和社交網站,尤其讓美國AI科技圈極為震撼。其最新發布的R1模型不僅在性能上比肩甚至超越了OpenAI的o1,並完全開源,而且以極低的成本實現了這一突破。
左為梁文鋒
1月20日,極少露面的DeepSeek老闆梁文鋒首次亮相新聞聯播,受邀參加座談會並發言。同一天,DeepSeek在官微上,發布了DeepSeek-R1發布,性能對標OpenAI o1正式版,並同步開源模型權重。
根據官方說法,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上,效能比肩OpenAI o1正式版。
DeepSeek-R1 API 服務定價為每百萬輸入tokens 1 元(快取命中)/ 4元(快取未命中),每百萬輸出tokens 16元。
比較OpenAI o1的API定價:每百萬輸入tokens 15美元、每百萬輸出tokens 60美元。
也就是說,每百萬輸出定價,DeepSeek-R1大概只有OpenAI o1的3.65%,擁有極高的性價比。
更令人驚訝的是,DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數模型的訓練,成本僅為557.6萬美元,遠低於其他頂級模型的訓練成本(如GPT- 4的10億美元)。
因此,有些人認為,DeepSeek可能會顛覆NVIDIA在AI硬體領域的主導地位。
1月24日,在國外大模型排名Arena上,DeepSeek-R1基準測試已升至全類別大模型第三,其中在風格控制類模型(StyleCtrl)分類中與OpenAI o1並列第一。
就在Arena放榜之後,全球關於DeepSeek的討論再次升級。
NVIDIA的高級研究科學家Jim Fan(範麟熙)評論道:“我們生活在這樣一個時代:一家非美國公司正在讓OpenAI的初衷得以延續——真正開放、為所有人賦能的前沿研究。 ”
1月25日,NVIDA的“老對手”AMD火速為DeepSeek“站台”,宣布全新的DeepSeek-V3車型已整合至AMD InstinctGPU上。
美国私人投资基金Noah’s Arc Capital Management认为,DeepSeek-V3模型的突破显著降低了AI培训成本,使AMD GPU成为比NVIDIA更具有成本效益的替代品,增强了AMD的市场地位。
那DeepSeek-R1為何讓美國乃至全球的AI圈有如此大的反應?因為它突破了一個規則,一個由美國和OpenAI建立的規則。
以往,全球AI的底層發展路線,是由OpenAI引領的,倡導“大力出奇蹟”,以規模製勝。但也種「軍備競賽」的發展模式也將AI發展帶入了一個怪圈,為追求更高的性能,大模型的體積只能不斷膨脹,參數數量呈現指數級增長,同時帶來了驚人的能源消耗和訓練成本,一家公司想發展AI,就必須投入高昂的成本向NVIDIA買GPU訓練,絕大多數公司根本難以為繼。
但DeepSeek的誕生,讓低成本、高性能AI成為了可能。大模型對算力投入的需求可能會從訓練側向推理側傾斜,即未來對推理算力的需求將成為主要驅動力。而NVIDIA等硬體商的傳統優勢更集中在訓練側,這可能會對其市場地位和策略佈局產生影響。
要知道,前不久美國總統川普剛在白宮宣布,日本軟銀集團、美國開放人工智慧研究中心和美國甲骨文公司三家企業將投資5,000億美元,用於在美國建立支援人工智慧(AI)發展的基礎設施。
美股大V「THE SHORT BEAR」在社群媒體上表示,DeepSeek創造了一個AI巨頭們的痛苦時刻,根據紅杉,美國AI公司每年必須產生約6000億美元收入來支付其AI硬體費用。但現在看來,這種冒險行為變得越來越無利可圖!
還有不少人把DeepSeek稱為“美國股市最大的威脅”,甚至把DeepSeek與近期NVIDIA的回調聯繫在一起。 1月24日,NVIDIA股價大跌3.12%,創下公司在年初CES展產品不如預期表現後的最大跌幅。
更重要的是,DeepSeek來自中國!一家名不見經傳的「小公司」!
「在美國每天發生的大量創新裡,這是非常普通的一個。他們之所以驚訝,是因為這是一個中國公司,在以創新貢獻者的身份,加入到他們遊戲裡去。畢竟大部分中國公司習慣follow,而不是創新。
他認為,中國AI不可能永遠處於跟隨的位置。我們常說中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。如果這不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。
NVIDIA的領先,不只是一個公司的努力,而是整個西方技術社群和產業共同努力的成果。他們能看到下一代的科技趨勢,手上有路線圖。中國AI 的發展,同樣需要這樣的生態。
很多國產晶片發展不起來,也是因為缺乏配套的技術社區,只有第二手訊息,所以中國必然需要有人站到技術的前沿。