当前位置: 首页 > java >正文

OpenAI传来捷报,刚刚夺金IOI,实现通用推理模型的跨越式突破

今天,AI 领域又添重磅消息 !OpenAI 的推理系统在 2025 年国际信息学奥林匹克(IOI)中斩获金牌,不仅在 AI 参赛者中稳居榜首,更在全球 330 名人类选手中排名第六,仅落后于 5 位顶尖选手。

这一成绩距其在IMO2025 中拿到金牌级表现不过数周,再次刷新了外界对 AI 推理能力的认知。

图片

本届 IOI 于玻利维亚苏克雷举办,7月27日开幕,8 月3日收官。

赛事中,中国队表现抢眼,全员摘金,其中刘恒熙(宁波市镇海中学)位列全球第一,范斯喆(浙江省诸暨市海亮高级中学)、陈昕阳(杭州第二中学)分别排名第三和第五,这三位中国高中生均在得分上超过了 OpenAI 的推理模型。

从具体成绩来看,OpenAI 的模型总分达 533.29 分,在各单项中展现了均衡的实力:多个科目拿到满分,部分科目得分虽略逊于顶尖人类选手,但整体表现已远超多数参赛者。

图片

值得关注的是,OpenAI 此次并未为 IOI 专门训练模型而是直接沿用了在 IMO 中夺冠的通用推理系统。

该系统严格遵守赛事规则:与人类选手一样,在 5 小时内完成答题,提交次数限制在 50 次;全程无互联网访问,不依赖检索增强生成(RAG)技术,仅能使用基础终端工具。

OpenAI 的研究科学家 Noam Brown 解释道,团队决定 “零改动” 将其应用于 IOI,最终通过 “多模型生成候选方案 + 启发式筛选最优解” 的策略完成提交。

图片

这一成绩与去年相比堪称 “跨越式进步”。2024 年 IOI 中,OpenAI 的 o1-ioi 模型虽经过专门微调,却仅以 213 分位列第 49 百分位,距铜牌一步之遥;而今年,通用模型未做针对性训练,却直接跃升至第 98 百分位,得分较去年翻倍。

图片

消息一出,业内反响热烈。网友直言:“没有专项训练却能做到这一点,太了不起了,这说明通用推理能力正变得异常强大。” ,更有人呼吁 OpenAI 尽快将相关技术推向公众:“用在 IMO 和 IOI 夺金的技术,值得一个公开版本!” 

从去年的 “险些拿铜” 到如今的 “金牌加身”,OpenAI 用一年时间证明了通用推理模型的潜力

正如其团队所言,AtCoder 世界总决赛、IMO、IOI 的连续佳绩,印证了最新研究在多步推理、自博弈等领域的突破。随着技术的成熟,或许用不了多久,这些曾在顶级赛事中崭露头角的 AI 能力,就将走进主流产品,为更多领域带来变革。

关注gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~

http://www.xdnf.cn/news/17667.html

相关文章:

  • 如何实现PostgreSQL的高可用性,包括主流的复制方案、负载均衡方法以及故障转移流程?
  • 【接口自动化】-11-接口加密签名 全局设置封装
  • 容器安全扫描工具在海外云服务器环境的集成方法
  • Element用法---Loading 加载
  • npm、pnpm、yarn区别
  • 一周学会Matplotlib3 Python 数据可视化-绘制饼状图(Pie)
  • 前沿技术借鉴研讨-2025.8.12 (数据不平衡问题)
  • Web项目Excel文件处理:前端 vs. 后端,企业级如何选择?
  • 【3】Transformers快速入门:大语言模型LLM是啥?
  • 11-docker单机版的容器编排工具docker-compose基本使用
  • centos 7 如何安装 ZipArchive 扩展
  • MySQL 数据库表操作与查询实战案例
  • MySQL概述
  • 计算机网络:ovn数据通信都是用了哪些协议?
  • 集成电路学习:什么是URDF Model统一机器人描述格式模型
  • 智能合约执行引擎在Hyperchain中的作用
  • 北京-4年功能测试2年空窗-报培训班学测开-第七十三天-投递简历-[特殊字符][特殊字符]
  • LangChain 框架 Parser 讲解
  • 介绍一下jQuery的AJAX异步请求
  • Nacos-1--什么是Nacos?
  • vue+flask基于规则的求职推荐系统
  • 3Ds Max的魔改利器:RailClone - 程序化建模的革命者
  • Linux Web服务器与WordPress部署笔记
  • DNS 服务详解与 BIND 部署
  • Django ORM查询技巧全解析
  • 基于Springboot+UniApp+Ai实现模拟面试小工具九:移动端框架搭建
  • 第二章:变量与简单数据类型
  • 【lucene】livedocs描述
  • 【华为机试】208. 实现 Trie (前缀树)
  • 图像打标工具/方法的分类和特点说明