深扒大模型價格戰:15家45款模型比拼誰真便宜誰「打幌子」?
降價、免費,立即生效! 618的風還是吹到了AI界。最近幾天,大模型廠商近乎瘋狂地打起了價格戰,這邊阿里雲剛宣布降價97%,那邊百度就宣布兩款模型全面免費,好不熱鬧!
據智東西不完全統計,截至發文,國內已有7家大模型企業“參戰”,包括字節跳動、阿里雲、百度、騰訊雲等互聯網大廠,智譜AI 、深度求索等AI創企,以及垂直賽道頭部玩家科大訊飛,紛紛爭奪「最便宜」「最高性價比」大模型這塊蛋糕。
▲國內大模型廠商參與價格戰情況(智東西製表,統計於2024年5月27日)
同時,也有百川智能、零一萬物等大模型創企直接宣布不參與這場紛爭,頗有種「敵軍圍困萬千重,我自巋然不動」的泰然。
這麼大張旗鼓的降價,大模型到底便宜了多少?智東西注意到,雖然這些大模型廠商宣揚的降價幅度動輒高達95%以上,甚至直接永久免費,但大多降的都是輕量級、入門級模型,真正的主力模型價格降幅並不大。
這也引發了疑問:價格是降下來了,性價比如何?降價的背後,是廠商自己的成本降下來了,還是靠補貼搶佔市場?價格戰會對產業、開發者帶來哪些影響,百模大戰會不會很快洗牌?
帶著這些疑問,智東西整理了15家企業45款模型API的價格對比,以及各廠商的主力模型測分數,試圖找出問題的答案。
一、位元組打響價格戰“第一槍”,源頭追溯至AI創企
首先來簡單回顧一下這次大模型價格戰的起承轉合,對這段進程有所了解的讀者,可以選擇直接跳至第二部分。
5月15日,位元組宣布旗下通用模型豆包pro-128k版模型推理輸入價格降至比行業價格低95.8%,豆包pro-32k模型推理輸入降至比行業價格低99.3%。
▲字節豆包大模型API定價(圖片來源:位元組跳動)
消息一公佈,立刻在業界引發巨震。 5月21日,阿里雲宣布旗下9款大模型全面降價,降幅最高達97%,兩款開源模型更是開啟七天限免。
▲阿里雲通義千問9款大模型降價(圖源:阿里雲)
幾個小時後,百度直接宣布兩款輕量級模型ERNIE Speed 、ERNIE Lite免費開放。
▲百度兩款文心大機型免費開放(圖片來源:百度)
僅僅一天後,又有兩位玩家入局。先是科大訊飛宣布輕量級模型API永久免費開放。
▲科大訊飛星火大模型降價或免費(圖片來源:科大訊飛)
隨後,騰訊雲宣布混元-lite即日起免費,其他車型降幅最高達87.5%。
▲騰訊雲混元大模式降價或免費(圖片來源:騰訊雲)
這場價格戰的源頭,在國內可追溯至一家名為深度求索的創企。
5月6日,深度求索開源MoE模型DeepSeek-V2,百萬tokens僅需1元。
▲主流大模型API價格比較表(圖源:深度求索,發佈於5月6日)
5月11日,大模型獨角獸智譜AI宣布其入門級模型GLM-3 Turbo的API降價為1元/百萬tokens。
▲智譜AI主要模型定價(圖源:智譜AI)
在國外市場,OpenAI於5月14日發布最新模型GPT-4o,定價相比GPT-4 Turbo再次減半,並且應用端向所有C端用戶免費開放。
▲OpenAI主要模型API定價(圖源:OpenAI)
雖然每次推出新模型都比上一代模型價格減半,幾乎已經成為了OpenAI的固定操作,不過這次的發布是否對國內的大模型價格戰產生了潛移默化的影響?我們不得而知。
二、15家企業45款模型價格比拼:誰是真便宜,誰是「打幌子」?
戰火紛飛,但大模型到底便宜了多少?
智東西統計了國內已宣布降價或免費的大模型企業及其主要模型最新定價,其中加粗的為每家公司旗下性能最強的最高配模型。
▲國內宣布降價的大模型企業及其定價(智東西製表,統計於2024年5月24日)
可以看出,各企業的降價力道各有千秋。如果只看最高配版本模型的話,優惠力度最大的當屬字節和深度求索,其都把價格降到了每百萬tokens個位數級別。
科大訊飛、騰訊雲、阿里雲緊追在後,其最高配模型的輸入或輸出定價都達到每百萬tokens百元以下。
那麼,其他沒有降價或降價幅度較小的主流大模型,目前的價格水準又如何呢?
智東西統計了包括OpenAI、Anthropic等國外廠商,以及國內主要大模型獨角獸的API定價,同樣用加粗標註了其各自的旗艦模型。
▲國內外其他主流大模型API定價(智東西製表,統計於2024年5月24日)
不難看出,在主力模型的價格方面,大家的差異其實沒那麼大。即便是OpenAI最新推出的「強到恐怖」的GPT-4o,也保持在幾十和百元左右級別。
而並未宣傳降價的零一萬物、MiniMax,其主要模型的定價從一開始就維持在較低的水平。
價格只是一方面因素,另一方面,降價的大模型表現究竟如何,也是大家共同關心的問題。畢竟就算再便宜,如果沒有“好貨”,對客戶來說也不見得是一筆好生意。
基於目前權威性較高的大模型盲測競技場LMSYS、國內由上海AI實驗室研發的開源測評體系OpenCompass 2.0評分,以及中文語言理解測評基準SuperCLUE,智東西整理了以上主流大模型旗艦款的評分及價格對比,供讀者參考。
▲國內外主流旗艦大模型評估基準分數及API價格(智東西製表,統計於2024年5月24日)
值得注意的是,Anthropic的Claude 3 Sonnet、阿里雲的Qwen1.5-11B/72B等模型雖然不是自家的最高配,但其測評基準表現與高配模型相差無幾,因此也納入性價比對比範圍內。
此外,位元組豆包大模型未公開測量分數,無法進行直覺的比較。火山引擎總裁譚待對此的解釋是,雖然模型參數、基準測試表現沒有特別披露,但在開放後大家很快就會看到第三方測試結果出來;同時普通用戶在使用豆包App後也會有自己的感受,其龐大的使用量也是模型能力很好的證明。
綜合來看,各家主力的旗艦模型性能相差不算太大。在性價比方面,零一萬物的Yi-Large、阿里雲的Qwen1.5-11B/72B、深度求索的DeepSeek-V2都有不錯的表現。而位元組作為價格戰的“發起人”,其主力模型Doubao-pro-128k,確實算得上是雲端運算大廠中壓價力度最大的一款。
三、技術突破、市場策略、收集數據?價格戰背後的真相
從大模型創企、雲端服務大廠,到垂直賽道玩家都參與了這場沒有硝煙的戰爭。背後的原因是什麼?
從大模型創企的角度來看,價格優勢可以使自己從一種供應商中間快速獲得關注和客戶,爭取生存空間、提升影響力;從雲廠商的角度,能夠利用價格手段進一步強化自身在雲服務市場的主導地位,對抗競爭對手衝擊。
作為首家參戰的大廠,位元組跳動對此的解釋是,能做到,且需要這麼做。
火山引擎總裁譚待在豆包大模型發布會後的採訪中稱,團隊在技術上有非常多優化手段,能大幅度降低部署成本等;同時為了讓大模型更廣泛地應用起來,團隊認為需要降低開發者的試誤成本,進而降低大模型創新的風險,
第一家出來「反擊」的阿里雲,稱降價的真正目的是普惠於市場。
阿里雲智慧集團資深副總裁、公有雲事業部總裁劉偉光在宣布全線主流大模型降價的同時,提出降價要具備四大條件:模型基模能力是否足夠領先、有沒有真正的推理資源、模型是否已產生商業效果、大模型是否為公司最核心的業務。
其他幾位「參賽者」暫時未公開出面解答降價的原因,不過根據其官宣公告,科大訊飛稱,希望「幫助開發者降低呼叫成本,加快AI普惠化」;騰訊雲的說法則是「重視技術累積與顧客體驗,會持續提供有競爭力的產品與服務」;深度求索提到了透過模型架構創新,每token成本大幅降低;智譜AI稱,降價是為了讓更多人都能用到其入門級模型產品。
總的來看,各大廠商對降價原因的解釋無外乎以下幾點:技術突破了,推理成本降低了;為開發者兜底,降低大模型的使用門檻;提升產品競爭力,積累客戶。
不過作為價格戰的參與者,他們的說法可能包含主觀或公關成分。賽事的另一邊,也有大模型公司選擇旁觀。
從他們的角度來看,考慮的因素可能包含成本、策略差異等,作為自身沒有雲端服務的企業,參與價格戰可能會導致較大的利潤損失,過度的價格競爭也可能影響自身的發展規劃和節奏。
百川智能本週剛發布新一代大模型Baichuan 4,其創始人兼CEO王小川在發布會上談道,現在出現降價潮是因為「大家太看好這個時代的發展前景,所以不惜免費也要入場」。
百川目前的商業模式即為透過API提供服務,在這種情況下,王小川認為打價格戰不是創業公司該做的事,“這是雲廠商從比較傳統的服務模式進入新的戰場”,從賣模型變成賣整套雲端服務。
零一萬物也於本周宣布其最新千億參數模型Yi-Large,在大模型競技場中取得總榜排名世界第七,中國大模型第一。談到對價格戰的看法,其創始人兼CEO李開復稱絕對不會跟這樣的定價來做對標,「對自己的模型表現是非常自豪的」。
他談道,國內常看到的ofo式瘋狂降價是雙輸的打法,而對大模型公司來說技術才是最重要的,如果技術不行,就屬於“純粹靠貼錢賠錢去做生意” 。
不在大模型API供應商這條賽道上的玩家,又是如何看待降價原因的呢?
獵豹移動董事長兼CEO傅盛認為,降價的核心原因不僅僅是大模型廠商“內卷”,而是蘋果、微軟、高通、聯想等設備廠商,紛紛重兵投入本地化AI算力和本地大模型所共同導致的結果。
本地算力的普及會使得一般大模型的使用場景大幅受限,對於大模型廠商來說,降價的目標不是為了獲取更多用戶,而是為了吸引開發者。如今,通用的聊天機器人App用戶量已經漲不動了,需要更多的應用程式出現。
另一方面,各大廠商在大模型性能上遇到了瓶頸,“誰也拿不出殺手鐧”,因此降低推理成本、降低售價成了高優先級任務。
瀾碼科技CEO周健則認為,大模型廠商現在降價的主要目的,更多還是為了收集資料。
在他看來,不只國內的公司是這樣,OpenAI選擇在C端免費開放GPT-4o也出於同樣的原因。一方面免費應用程式吸引用戶,另一方面API降價吸引開發者,從而收集更多的數據,屬於「燒錢換數據,競爭優質數據」的階段。
總的來說,比起真正的大模型“內卷”,這場價格戰更像是一場雲端運算大廠為了爭奪雲端市場,在另一賽道布下的戰局。
四、價格戰的兩面性:利多開發者,擠佔創企生存空間
再回到產業的角度,這場價格戰對大模型、雲端服務等產業可能帶來什麼樣的影響?
阿里原副總裁賈揚清近日在朋友圈分享了自己的觀點。他談道,站在整個AI產業的角度,降價是個“拍腦袋就可以做的簡單策略”,但距離真正的ToB商業成功還很遠。
在他看來,如今大模型API能否被人使用,並不取決於其定價是否便宜,而取決於能否創造業務價值。最終能贏得商戰的,也許不是“最便宜的”,而是“最能落地的”。
▲賈揚清評大模型價格戰
傅盛認為,這場價格戰基本上宣告了大模型新創公司必須尋找新的商業模式。
從目前的「戰況」來看,降價最兇的都是自己有雲服務的大廠,他們透過大模型來獲取雲客戶,「羊毛出在豬身上,降得起」。但創企沒有這樣的生態,必須另尋商業模式。
此外,傅盛也認為降價對企業用戶影響有限。因為比起AI應用,企業用戶更關心資料安全,而現在開源小參數大模型結合應用套件,已經可以滿足絕大多數的企業需求,私有化大模型的成本已經很低了。
任何事物都具有兩面性,價格戰也不例外。一方面它可能影響整個產業的穩定發展,甚至引發惡性競爭;另一方面它也能淘汰競爭力較弱的企業,推動產業集中。
而從開發者或大模型消費者的角度來看,這無疑是個重大利多。
週健談道,瀾碼科技作為大模型API的消費者,在選擇大模型時更加關注模型的參數和準確率。此外模型的連續性也是一個非常重要的屬性,模型的更新速度足夠快,才能不斷升級應用的能力,以保持競爭力並滿足市場需求。
他認為,隨著開發成本大幅下降,爆款應用程式的開發將變得更加容易;其次,對SaaS端平台公司來說,價格下降有利於大模型更快進入私有化部署階段。
彩雲科技CEO袁行遠近日在接受智東西採訪時談道,現在處於一個市場搶佔的過程,大模型的價格肯定是存在一些補貼的。從電力發展的歷程來看,這些資源未來都會變得越來越便宜,甚至免費,因此廠商提前去做一些補貼也不會有太大的影響。
總的來看,大模型價格戰對產業的影響具有兩面性,既能夠促使產業格局變化和商業模式創新,也為開發者帶來機遇,有利於爆款應用的開發和大模型私有化部署。
結論:百模大戰或面臨洗牌,誰能笑到最後?
百模大戰進入深水區,大模型廠商也從卷性能、卷應用,發展到卷價格。不過總的來看,大部分企業在降價時還是為自己留了後路,例如只下放輕量級模型,或是限時優惠。
目前參與價格戰的玩家,多還是自有雲端服務的網路大廠。對他們而言,參與價格戰可能更多是出於戰略佈局和市場主導權的考慮,因為其有能力承受一定程度的價格波動和成本壓力。
而大模型創企相對資源有限,在價格戰中可能更加註重生存和盈利的平衡,需要更加謹慎地應對價格變化,在保證一定盈利水平的前提下提供有競爭力的價格。
來源:智東西