对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
11月18日消息,对标代推第日前,布新国内人工智能公司月之暗面推出的理模Kimi国产大模型正式发布k0-math。
k0-math是型中Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,考高考考通过模拟人脑的研全思考和反思过程,大幅提升解决数学难题的对标代推第能力。
据了解,布新在多项数学基准能力测试中,理模k0-math的型中表现能对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。
根据官方公布的考高考考结果,在中考、研全高考、对标代推第考研以及包含入门竞赛题的布新MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型,理模拿下第一。
在业界最常使用的数学能力基准测试MATH 中,k0-math模型得分93.8,超过 o1-mini的90分和o1-preview的85.5分。
官方表示,k0-math这一成绩仅次于暂未开放使用的o1完全版94.8分。
据介绍,常规模型的设定目标是尽快提供问题的答案,但k0-math不同,k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
不过,月之暗面坦言,k0-math虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答LaTeX格式难以描述的几何图形类问题。
另外,k0-math还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1等于几,k0-math模型可能会过度思考,对于高考难题和IMO题目依然有一定概率做错、猜答案。
月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。
- ·9胜2平!皇马对阵塞维利亚连续11场不败,上次输球是2018年
- ·罗体:蒙特拉是罗马新帅热门人选,他战术理念精确并且很熟悉罗马
- ·26岁生日快乐!巴萨为孔德送上生日祝福
- ·大腿!B费曼联首秀以来参与155球,英超球员同期仅少于萨拉赫
- ·[流言板]准绝杀+赛季首次三双!里夫斯全场20中8砍下26分10板10助攻
- ·拉诺基亚:米兰太不稳定,踢皇马表现出色几天后踢卡利亚里又断电
- ·西媒:皇马青训球员担心一队高强度训练有受伤风险,平图斯被质疑
- ·司马光是不是刷票了,这🪝篮子也配?
- ·Epic喜加一:《传说法师》免费领取
- ·如何在用新音乐盒的同时白嫖一个鼠标垫?
- ·迪亚洛告别范尼:谢谢你做得一切,祝你在未来一切顺利
- ·毁灭测试小米SU7 Ultra碳陶刹车盘:全盘都磨红了 就是用不坏
- ·中国监控摄像头线上销量创全年最高峰 小米夺双第一
- ·腾讯重拳出击!全国首例《CFHD》制售外挂案告破
- ·记者:阿方索团队向皇马确认球员决定加盟,拒绝巴萨曼联等队
- ·R.I.P. 厄瓜多尔国脚车祸离世,年仅22岁
- ·媒体人:一些归化属于可有可无,不见得就比本土球员强多少
- ·迪亚洛告别范尼:谢谢你做得一切,祝你在未来一切顺利
- ·妙选硬c?看我踢不踢你就完事了
- ·意媒:米兰想冬窗先租后买齐尔克泽&前提约维奇离队 尤文也想签他
- ·广州一公园被指将枯草喷涂成绿色 真相曝光:肥料增绿剂
- ·[流言板]气氛真好!比赛进入暂停,勇士现场球迷激情热舞
- ·TA:斯洛特的要求很公平但非常严格,遇到问题他会先从自身找原因
- ·美国计划花33.5亿美元 将一个核动力“蜻蜓”送入太空 寻找外星生命
- ·[流言板]准绝杀+赛季首次三双!里夫斯全场20中8砍下26分10板10助攻
- ·索默:我会研究前锋的射门习惯,不想透露普利西奇的罚点球方式