当前位置: 首页 > news >正文

[250507] 小米发布首个推理模型 MiMo,70亿参数展现卓越性能

目录

    • 小米重磅发布:首个推理大模型MiMo开源,70亿参数展现卓越性能
      • MiMo模型的显著优势
      • 独特的训练方法驱动能力提升
      • 全面开源

小米重磅发布:首个推理大模型MiMo开源,70亿参数展现卓越性能

小米近日正式发布了其首款针对推理(Reasoning)任务而设计的开源大型语言模型——Xiaomi MiMo。该模型拥有70亿参数,旨在攻克当前预训练模型在推理能力方面的瓶颈,探索如何更有效地激发模型的深层推理潜能。MiMo的推出,标志着小米在人工智能领域,特别是在提升模型数学推理和代码生成能力方面迈出了重要一步。

MiMo模型的显著优势

根据小米官方介绍,Xiaomi MiMo模型在多个权威公开测评中表现突出:

  • 在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)的评测中,MiMo以其70亿参数的规模,性能超越了OpenAI的闭源推理模型o1-mini以及阿里巴巴的开源推理模型QwQ-32B-Preview。
  • 在与近期热门的DeepSeek-R1等模型对比中,MiMo-7B在相同的强化学习训练数据条件下,其在数学与代码领域的推理能力显著领先于现有的经典开源32B模型,如DeepSeek-R1-Distill-7B和Qwen2.5-32B。

这些成绩充分展示了MiMo模型在推理任务上的优越性。

独特的训练方法驱动能力提升

MiMo模型推理能力的显著提升,得益于其在预训练与后训练阶段的多层面创新:

  • 预训练阶段:通过整合丰富的推理语料,合成了约200B tokens的推理数据。训练过程中采用了三阶段训练方法,逐步增加训练难度,总计训练了25T tokens,以确保模型在复杂推理任务上的稳健表现。
  • 后训练阶段:聚焦于高效且稳定的强化学习算法和框架。引入了“测试难度驱动奖励”(Test Difficulty Driven Reward)策略,有效解决了困难算法问题中奖励稀疏的挑战。同时,采用“简单数据重采样”(Easy Data Re-Sampling)策略,提升了强化学习训练的稳定性和有效性。为加速训练,小米还设计了无缝回放系统,使RL训练速度提高了2.29倍,验证速度提升了1.96倍。

全面开源

小米已将MiMo全系列模型在HuggingFace平台全面开源,方便广大用户和研究者访问和使用。

  • HuggingFace链接:https://huggingface.co/XiaomiMiMo

小米表示,MiMo是其新成立的大模型核心团队的初步尝试。

来源:
https://www.aibase.com/zh/news/17705

更多内容请查阅 : blog-250507

http://www.xdnf.cn/news/317755.html

相关文章:

  • 使用 Java 11 的 HttpClient 处理 RESTful Web 服务
  • 【Linux】Linux环境基础开发工具
  • 精益数据分析(46/126):深入剖析用户生成内容(UGC)商业模式
  • 并发设计模式实战系列(17):信号量(Semaphore)
  • 解构与重构:自动化测试框架的进阶认知之旅
  • Spring Boot 为 MongoDB 自动配置了哪些核心 Bean?
  • Make:独立创造者手册——从0到1的商业自由之路
  • 任意文件读取漏洞
  • 阿里联合北大开源数字人项目FantasyTalking,输出内容更加动态化~
  • HarmonyOS Next~HarmonyOS应用测试全流程解析:从一级类目上架到二级类目专项测试
  • 游戏引擎学习第262天:绘制多帧性能分析图
  • 标量/向量/矩阵/张量/范数详解及其在机器学习中的应用
  • MCP 入门指南
  • Kubernetes生产环境实战:深度排查Pod内存溢出(OOM)问题指南
  • 优选算法系列(8.多源BFS)
  • Vue3响应式:effect作用域
  • linux命令>/dev/null 2>1的含义
  • 【北京迅为】iTOP-4412精英版使用手册-第七章 Android 4.0/Linux源码编译
  • 在 Vue 2 中使用 qrcode 库生成二维码
  • Python 识别图片上标点位置
  • CSDN文章都是VIP
  • Ubuntu 使用dotfiles个性化配置模板
  • 使用 Apache POI 生成包含文本和图片的 Word 文档
  • 【MCP】从0到1实现一个MCP Client
  • 【Python类(Class)完全指南】面向对象编程入门
  • 阿里云服务器-centos部署定时同步数据库数据-dbswitch
  • 【Django】中间件
  • 软件工程(三):模块的内聚模型
  • 如何在大型项目中解决 VsCode 语言服务器崩溃的问题
  • 政务浏览器 一站式首页功能配置说明