发布时间:2026-02-28 作者:admin
1近日,字节跳动Seed团队于12月24日推出了新一代形式化数学推理模型Seed Prover 1.5。这款模型依托大规模智能体强化学习技术进行训练,在数学竞赛题的形式化证明方面的能力得到了进一步提升。
根据官方披露的信息,该模型在IMO 2025的前5道题目中,仅用16.5小时就生成了能够完整编译验证的Lean证明代码,经换算其成绩达到了往届IMO的金牌分数线。而在Putnam 2025的12道赛题里,它耗时9小时便完成了其中11道题的可验证代码生成。此外,在Putnam历史评估数据集上,该模型的问题解决率达到了88%。
团队指出,目前的模型依旧主要适用于“规则明确、背景限定”的竞赛类题目,和前沿数学研究中所需要的长链条推理、依赖文献的推理能力还存在差距。相关技术报告已经对外公开,接下来会开放API接口供研究人员进行体验。
发布于 2026-03-10 16:05:18
发布于 2026-03-10 16:05:14
发布于 2026-03-10 16:04:40
发布于 2026-03-10 16:04:34
发布于 2026-03-10 16:04:30
发布于 2026-03-10 16:03:55