返回顶部
AiGoe.com 首页 AI快讯

字节推出 Seed 新模型:数学竞赛金牌水平,AI 推理能力再升级 ...

AI快讯 2025-12-25 17:53 47人浏览 0人回复
摘要

字节跳动旗下 Seed AI 团队近期推出了最新数学推理模型 Seed Prover1.5,在国际数学奥林匹克(IMO)中取得金牌成绩,再次证明人工智能在数学推理领域的飞跃进展。该模型在 16.5 小时内解决了 IMO 2025 前五道题,仅 ...

 字节跳动旗下 Seed AI 团队近期推出了最新数学推理模型 Seed Prover1.5,在国际数学奥林匹克(IMO)中取得金牌成绩,再次证明人工智能在数学推理领域的飞跃进展。该模型在 16.5 小时内解决了 IMO 2025 前五道题,仅失一题,最终以 35 分达标金牌水平,这一表现与谷歌 Gemini 相当,而字节此前版本仅能在三天内完成四道题并获得银牌。Seed Prover1.5 的出色表现,为 AI 数学推理树立了新的标杆。

Seed Prover1.5 的成功得益于 大规模强化学习 的应用,使模型在解决复杂数学题的成功率从约 50% 提升至接近 90%。同时,该模型在北美数学竞赛 Putnam 中也取得了历史最佳成绩,显示其跨竞赛场景的强大适应能力。

技术上,Seed Prover1.5 采用了两项核心创新:Agentic ProverSketch Model。Agentic Prover 利用 Lean 等形式语言进行可验证数学推理,使模型能够生成严谨、可验证的证明结果,并结合外部工具如数学库检索和 Python 脚本进行辅助计算。Sketch Model 则模拟人类数学家的思路,先生成草稿式的非正式证明,列出关键引理与逻辑步骤,再转化为正式证明。该方法不仅提高了模型的逻辑规划能力,也降低了复杂问题求解的难度。


Seed Prover1.5 的问世,不仅展示了字节在 AI 数学推理领域的创新实力,也为未来数学研究、教育以及科学计算提供了新的可能。随着这类模型不断发展,人工智能将在解决高难度问题、辅助科研决策和教育训练中发挥更加重要的作用,为智能推理打开更广阔的应用空间。

本文暂无评论,快来抢沙发!

推荐阅读
热门问答
AiGoe.com 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2001-2020, Tencent Cloud. |
  • | 营业执照 | |星点互联科技有限公司|鲁ICP备19001237号-21|鲁公网安备 4236902302000354号