對標OpenAI o1!Kimi發佈新一代推理模型:中考高考考研全第一
快科技11月18日消息,日前,國內人工智能公司月之暗面推出的Kimi國產大模型正式發佈k0-math。
k0-math是Kimi推出的首款推理能力強化模型,採用全新強化學習和思維鏈推理技術,通過模擬人腦的思考和反思過程,大幅提升解決數學難題的能力。
據瞭解,在多項數學基準能力測試中,k0-math的表現能對標OpenAI o1系列可公開使用的兩個模型:o1-mini和o1-preview。
根據官方公佈的結果,在中考、高考、考研以及包含入門競賽題的MATH等4個數學基準測試中,k0-math初代模型成績超過o1-mini和o1-preview模型,拿下第一。
在業界最常使用的數學能力基準測試MATH 中,k0-math模型得分93.8,超過 o1-mini的90分和o1-preview的85.5分。
官方表示,k0-math這一成績僅次於暫未開放使用的o1完全版94.8分。
據介紹,常規模型的設定目標是儘快提供問題的答案,但k0-math不同,k0-math模型在做題過程中會花更長的時間來推理,包括思考和規劃思路,並且在必要時自行反思改進解題思路,提升答題的成功率。
不過,月之暗面坦言,k0-math雖然擅長解答大部分很有難度的數學題,但是當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題。
另外,k0-math還有一些侷限性需要突破,包括對於過於簡單的數學問題,例如1+1等於幾,k0-math模型可能會過度思考,對於高考難題和IMO題目依然有一定概率做錯、猜答案。
月之暗面表示,這些侷限性既是機遇,也是挑戰,預計將在下一階段的模型迭代中逐步得到改善。