Kimi發布新一代推理模式：中考高考研全第一表現對標OpenAI o1

國內人工智慧公司月之暗面推出的Kimi國產大模型正式發表k0-math。 k0-math是Kimi推出的首款推理能力強化模型，採用全新強化學習與思考鏈推理技術，透過模擬人腦的思考與反思過程，大幅提升解決數學難題的能力。

據了解，在多項數學基準能力測驗中，k0-math的表現能對標OpenAI o1系列可公開使用的兩個模型：o1-mini和o1-preview。

根據官方公佈的結果，在中考、高考、考研以及包含入門競賽題的MATH等4個數學基準測試中，k0-math初代模型成績超過o1-mini和o1-preview模型，拿下第一名。

在業界最常使用的數學能力基準測試MATH 中，k0-math模型得分93.8，超過o1-mini的90分和o1-preview的85.5分。

官方表示，k0-math這一成績僅次於暫未開放使用的o1完全版94.8分。

根據介紹，常規模型的設定目標是盡快提供問題的答案，但k0-math不同，k0-math模型在做題過程中會花更長的時間來推理，包括思考和規劃思路，並且在必要時自行反思改善解題思路，提升答題的成功率。

不過，月之暗面坦言，k0-math雖然擅長解答大部分很有難度的數學題，但是當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題。

另外，k0-math還有一些限制需要突破，包括對於過於簡單的數學問題，例如1+1等於幾，k0-math模型可能會過度思考，對於高考難題和IMO題目依然有一定機率做錯、猜答案。

月之暗面表示，這些限制既是機遇，也是挑戰，預計將在下一階段的模型迭代中逐步改善。

WONGCW 網誌