字节跳动旗下 Seed AI 团队近期推出了最新数学推理模型 Seed Prover1.5,在国际数学奥林匹克(IMO)中取得金牌成绩,再次证明人工智能在数学推理领域的飞跃进展。该模型在 16.5 小时内解决了 IMO 2025 前五道题,仅 ...
|
字节跳动旗下 Seed AI 团队近期推出了最新数学推理模型 Seed Prover1.5,在国际数学奥林匹克(IMO)中取得金牌成绩,再次证明人工智能在数学推理领域的飞跃进展。该模型在 16.5 小时内解决了 IMO 2025 前五道题,仅失一题,最终以 35 分达标金牌水平,这一表现与谷歌 Gemini 相当,而字节此前版本仅能在三天内完成四道题并获得银牌。Seed Prover1.5 的出色表现,为 AI 数学推理树立了新的标杆。 Seed Prover1.5 的成功得益于 大规模强化学习 的应用,使模型在解决复杂数学题的成功率从约 50% 提升至接近 90%。同时,该模型在北美数学竞赛 Putnam 中也取得了历史最佳成绩,显示其跨竞赛场景的强大适应能力。 技术上,Seed Prover1.5 采用了两项核心创新:Agentic Prover 和 Sketch Model。Agentic Prover 利用 Lean 等形式语言进行可验证数学推理,使模型能够生成严谨、可验证的证明结果,并结合外部工具如数学库检索和 Python 脚本进行辅助计算。Sketch Model 则模拟人类数学家的思路,先生成草稿式的非正式证明,列出关键引理与逻辑步骤,再转化为正式证明。该方法不仅提高了模型的逻辑规划能力,也降低了复杂问题求解的难度。 Seed Prover1.5 的问世,不仅展示了字节在 AI 数学推理领域的创新实力,也为未来数学研究、教育以及科学计算提供了新的可能。随着这类模型不断发展,人工智能将在解决高难度问题、辅助科研决策和教育训练中发挥更加重要的作用,为智能推理打开更广阔的应用空间。 |
评论