人工智能刚刚在国际数学奥林匹克比赛中获得金牌 🥇 OpenAI 和谷歌的模型在真实考试规则下,使用通用 LLM 解决了 5/6 道题目。 正式数学的 AGI 时代已经开始 👇
赢得金牌意味着得分35/42。这是全球只有少数精英高中生才能达到的水平。 OpenAI和谷歌的模型都达到了这个标准。 没有计算器。没有搜索。只有自然语言推理。
谷歌的Gemini 2.5使用了“深度思考”模式: - 并行探索解决方案 - 在证明策略和数学语料库上进行训练 - 在多步骤推理任务上使用强化学习 它的证明如此精致,以至于IMO评分员称其为可发表的。
OpenAI的模型并没有为IMO进行训练。 它使用了: - 一般的强化学习技术 - 没有互联网或工具 - 自然语言证明
OpenAI让3位前国际数学奥林匹克奖牌获得者独立评估每个证明,达成了一致共识。 该模型甚至知道在P6上没有有效答案... 展示了它在推理、错误检查和自我意识方面的能力。
我们相信,人工智能的最大影响可能在于数学。 为什么?因为数学驱动着从去中心化金融逻辑到协议安全的一切,并且是可验证的。 像菲尔兹奖得主一样推理的人工智能将重塑我们的构建方式。
在未来几年,我们预计人工智能将: • 完善高中和大学水平的数学(IMO,普特南) • 解决高级研究问题 • 贡献于基础定理的形式化证明 • 扩展协作的去中心化数学
我们看到一个未来,数学不仅仅是自动化的,而是民主化、无信任和可组合的。💙
查看原文
3,182
72
本页面内容由第三方提供。除非另有说明,欧易不是所引用文章的作者,也不对此类材料主张任何版权。该内容仅供参考,并不代表欧易观点,不作为任何形式的认可,也不应被视为投资建议或购买或出售数字资产的招揽。在使用生成式人工智能提供摘要或其他信息的情况下,此类人工智能生成的内容可能不准确或不一致。请阅读链接文章,了解更多详情和信息。欧易不对第三方网站上的内容负责。包含稳定币、NFTs 等在内的数字资产涉及较高程度的风险,其价值可能会产生较大波动。请根据自身财务状况,仔细考虑交易或持有数字资产是否适合您。