Tomshardware:DeepSeek可能沒有宣傳那麼神沒什麼奇蹟
近一週以來,DeepSeek不僅引發了美國矽谷的恐慌,也讓許多原本不關心AI的人感受到了中國AI大模型的震撼。不過,國外老牌硬體網站Tomshardware發文稱,DeepSeek可能沒有宣傳的那麼具有顛覆性,在AI領域不存在奇蹟。
以下為文章節錄:
中國新創公司DeepSeek最近因其先進的AI模型R1的運算資源使用量驚人地低,而成為科技界的焦點。
該公司聲稱DeepSeek的訓練成本僅為600萬美元以及2048個GPU,其最新的R1模型可以與Open AI的o1相媲美。
然而,產業分析公司SemiAnalysis報告稱,DeepSeek背後的公司花費了16 億美元的伺服器成本,並擁有50,000 個NVIDIA Hopper GPU。
報告稱,DeepSeek經營著一個擁有約50,000個Hopper GPU的龐大運算基礎設施。根據SemiAnalysis 的數據,其中包括10,000個H800和10,000個H100,另外也購買了H20晶片。
這些資源分佈在多個位置,用於AI訓練、研究和財務建模等。 SemiAnalysis的數據顯示,該公司在伺服器上的總資本投資約為16億美元,估計營運成本為9.44億美元。
DeepSeek 起源於High-Flyer(幻方),這是一家中國對沖基金,很早就採用了人工智慧,並在GPU上投入了大量資金。
2023 年,High-Flyer成立了DeepSeek,作為一家專注於人工智慧的獨立企業。與許多競爭對手不同,DeepSeek 仍是自籌資金,這使其在決策方面具有速度和靈活性。
DeepSeek的一個主要優勢在於它能夠運行自己的資料中心,而大多數其他AI新創公司則依賴外部雲端供應商。這種獨立性允許其完全控制測試和AI模型優化。
此外,它能夠快速迭代而不受外部瓶頸的影響,這使得DeepSeek與業內傳統參與者相比效率極高。
根據SemiAnalysis的數據,DeepSeek只在中國境內招聘,注重員工的技能和解決問題的能力,而非資歷。
DeepSeek針對北京大學、浙江大學等知名大學招募人才,並提供極具競爭力的薪水。根據研究,DeepSeek的一些人工智慧研究人員的薪酬超過130萬美元(約942.7萬元),超過了Moonshot(月之暗面)等其他領先的中國人工智慧公司的薪酬。
SemiAnalysis報告稱,由於人才的湧入,DeepSeek率先推出了MLA等創新技術。 DeepSeek 強調效率和演算法改進,而不是蠻力擴展,重塑了人們對AI模型開發的期望。
基於多種原因,這也讓大家相信,科技的快速進步可能會減少對高階GPU的需求,進而對NVIDIA等公司產生利空應影響。
最近有消息稱,DeepSeek 僅花費600萬美元訓練其最新模型,但這個數字僅指總訓練成本的一部分——不包括研究、模型改進、數據處理或整體基礎設施費用。
事實上,自成立以來,DeepSeek在人工智慧開發上花費了超過5億美元。 SemiAnalysis認為,與受官僚主義困擾的大型公司不同,DeepSeek 的精實結構使其能夠積極推動人工智慧創新。
DeepSeek的崛起凸顯了一家資金雄厚的獨立AI公司如何挑戰產業領導者。但現實情況要複雜得多:SemiAnalysis 認為DeepSeek的成功建立在數十億美元的策略投資、技術突破和有競爭力的員工隊伍之上。
這意味著沒有什麼奇蹟。正如馬斯克一年前指出的那樣,如果你想在AI領域具有競爭力,你必須每年投入數十億美元。
