彭博社深入剖析DeepSeek:中國AI黑馬為何引發全球關注?
彭博社週一發文稱,中國AI創業公司DeepSeek(深度求索)成立只有一年多時間,但它的AI模型已經取得了突破性進展,性能堪比世界上最出色的聊天機器人,成本卻似乎遠低於後者,這讓美國矽谷感到震驚。
深度搜尋
彭博社指出,DeepSeek的異軍突起可能與先前的普遍看法相反。此前,業界普遍認為AI的未來發展需要源源不絕的算力和能源投入作支撐。隨著DeepSeek的創新引發的熱潮不斷升溫,投資者開始消化它對美國競爭對手及其硬體供應商的影響,全球科技股在本月底大跌。
DeepSeek 到底是什麼?
DeepSeek由量化基金幻方量化負責人梁文峰於2023年創立。該公司開發的AI模型是開源的,這意味著整個開發人員社群都可以檢查和改進軟體。其行動應用程式在1月初發布後,在美國iPhone下載排行榜上飆升至榜首。
該應用程式與OpenAI的ChatGPT等其他聊天機器人的區別在於,在對提示做出回應之前闡明其推理。該公司聲稱其R1版本提供的性能與OpenAI的最新版本相當,並已向有興趣使用該技術開發聊天機器人的個人授予許可。
DeepSeek R1與OpenAI或Meta的模型相比如何?
雖然DeepSeek並未全面揭露其R1新模型的細節,但該模型的訓練和開發成本似乎僅為OpenAI或Meta最強產品的一小部分。 R1的效率顯然要高得多,這不禁讓人質疑業界是否仍需要投入大量資金去購買英偉達等公司的最新、最強大的AI加速器。這也讓外界更重視美國針對中國的先進AI晶片出口管制,因為這些管制就是為了防止中國取得像DeepSeek這樣的突破。
DeepSeek表示,R1模型在幾個主要基準測試中的表現接近或超越了競爭對手的模型,例如測試數學能力的AIME 2024、測試常識的MMLU和測試問答性能的AlpacaEval 2.0。它也在加州大學柏克萊分校研究生開發的AI系統排名網站Chatbot Arena上名列前茅。
DeepSeek何時引發了全球關注?
自從2023年發布最早模型以來,DeepSeek就一直備受關注。去年11月,它向世界預覽了旨在模仿人類思維的DeepSeek R1推理模型,為其行動聊天機器人應用提供了技術支援。再加上網頁版,此聊天機器人迅速成為全球知名的廉價OpenAI替代品。矽谷知名投資人馬克·安德森(Marc Andreessen)稱之為「AI的斯普特尼克時刻」(源自冷戰時期的歷史術語,現已成為一種隱喻,用來描述某個事件或時刻引發強烈的危機感或緊迫感,促使國家、組織或個人採取行動以應對競爭或挑戰)。
DeepSeek的應用程式圖標
根據市場追蹤公司App Figures的數據,截止到今年1月25日,DeepSeek行動應用程式已被下載160萬次,並在澳洲、加拿大、中國、新加坡、美國和英國的iPhone應用程式商店中排名第一。
DeepSeek的創辦人是誰?
DeepSeek創辦人是梁文鋒1985年出生於廣東,浙江大學電子與資訊工程學士和碩士學位。公開資訊顯示,他以1000萬元人民幣的註冊資本創立了DeepSeek。
梁文峰在接受媒體採訪時表示,進一步進步的瓶頸不是更多的融資,而是美國對獲得最佳晶片的限制。他說,他的大多數頂尖研究人員都是來自中國頂尖大學的應屆畢業生,並強調中國需要發展自己的國內生態系統,類似於圍繞英偉達及其人工智慧晶片構建的生態系統。
梁文峰指出,“更多的投資不一定會帶來更多的創新。否則,大公司將包辦所有創新。”
DeepSeek在中國AI產業處於何種地位?
從阿里巴巴集團、百度到騰訊,中國的科技巨頭都投入了大量資金和資源,為各自的AI模式爭取硬體和客戶。和李開復的零一萬物一樣,DeepSeek憑藉其開源策略脫穎而出。此策略旨在快速吸引最多的用戶,然後在龐大用戶基礎上製定創收策略。
由於DeepSeek的模型更實惠,它已經在協助降低中國AI開發商的成本。在過去一年半時間裡,其他規模更大的公司已經在中國打起了價格戰,出現了連續的降價浪潮。
它對全球AI市場有什麼影響?
DeepSeek的成功可能會促使OpenAI和其他美國AI供應商降低價格,以保持其現有領先地位。這也讓人們對Meta、微軟等公司的龐大支出產生質疑。這些公司已經分別承諾今年將投入650億美元或更多的資本支出,主要用於AI基礎設施。如果效率更高的模式能夠用更少的投入與現有的模式競爭,那麼它就會對傳統的大規模資金投入模式構成挑戰。
DeepSeek崛起也引發了全球股市動盪。投資人開始拋售英偉達、阿斯麥等受惠於AI服務需求激增的公司股票。科大訊飛等與DeepSeek有關的中國公司股價則出現上漲。
全球開發者已經在嘗試使用DeepSeek的軟體,並希望基於它開發工具。這可能加速先進AI推理模型的普及,同時也可能引發更多擔憂,那就是該如何圍繞著它的使用來設立護欄。 DeepSeek取得的進展可能促使相關法規的出台,以控制AI的開發方式。
有何短板?
DeepSeek的雲端基礎設施可能會因其模型的突然走紅而受到考驗。 1月27日,該公司就經歷了短暫的大宕機。隨著新舊用戶向其聊天機器人提出更多問題,DeepSeek將不得不應對更大的流量。