当前位置: 首页 > web >正文

微软正在公开测试其首个完全自主训练的大语言模型——MAI-1-preview

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

2025年8月28日,多家媒体报道,微软正在公开测试其首个完全自主训练的大语言模型——MAI-1-preview。这一举措不仅意味着微软试图减少对OpenAI的依赖,也可能加剧两家公司之间的竞争。

微软AI部门首席执行官Mustafa Suleyman表示,MAI-1-preview是公司从头到尾独立训练完成的首个基础模型。目前,该模型已在LMArena网站上对外开放测试,用户可以在平台上进行评估。微软还发布了开发者申请表,允许有兴趣的团队申请提前体验。公司计划未来几周将该模型逐步应用到Copilot的部分文本场景中,以便通过用户反馈不断优化。

长期以来,微软的Bing搜索引擎、Windows 11操作系统以及其他核心产品,主要依赖OpenAI的模型来驱动AI功能。微软本身也是OpenAI的最大投资方之一,已累计投入逾130亿美元,同时为OpenAI提供云计算基础设施支持。然而,在微软2024年的年度报告中,OpenAI已被列入竞争对手名单,与亚马逊、苹果、谷歌和Meta并列。与此同时,OpenAI也在逐渐拓展合作伙伴,近期开始依赖CoreWeave、Google和Oracle等公司提供的算力,以应对ChatGPT每周覆盖7亿用户的庞大需求。

在LMArena的排名中,MAI-1-preview在文本任务上位列第13,落后于Anthropic、DeepSeek、Google、Mistral、OpenAI和xAI的模型。不过微软强调,该模型训练依托了约15,000块Nvidia H100 GPU,并已配备运行中的Nvidia GB200芯片集群。Suleyman在社交平台X上表示,公司对未来有着宏大的规划,包括模型的进一步提升、算力的扩展以及通过微软产品触达数十亿用户的愿景。

在推出MAI-1-preview之前,微软曾发布过一系列小型开源语言模型Phi。但此次的新模型,被视为微软真正意义上的首个完全自主基础模型。值得注意的是,Suleyman本人曾是Google收购的AI研究公司DeepMind的联合创始人,后来创立了Inflection AI,并在2024年率领大部分团队成员加盟微软。这一背景,使得微软AI团队在近几个月迅速扩张,其中包括约二十名来自DeepMind的专家。

这一动作显示,微软一方面仍与OpenAI保持深度战略合作关系,另一方面也在加快自研模型的步伐,力图在未来的AI竞争中掌握更大主动权。

http://www.xdnf.cn/news/19199.html

相关文章:

  • python 日常学习记录
  • Java全栈开发工程师面试实录:从基础到微服务的深度技术解析
  • 【python】相机输出图片时保留时间戳数据
  • Blender模拟结构光3D Scanner(三)获取相机观测点云的真值
  • 信息系统生命周期
  • 小程序版碰一碰发视频:源码搭建与定制化开发的源头技术解析
  • CSS scale函数详解
  • nginx 怎么将 https 请求转为 http
  • Docker 实战 -- EMQX
  • 第22章笔记|把“可传参脚本”打磨成“高级好用的工具”
  • 链表(LinkedList)
  • docker compose设置命令别名的方法
  • Swift 解法详解:LeetCode 366《寻找二叉树的叶子节点》
  • 贪心算法面试常见问题分类解析
  • 微服务入门指南(一):从单体架构到服务注册发现
  • PPT处理控件Aspose.Slides教程:使用 C# 编程将 PPTX 转换为 XML
  • Pytorch超分辨率模型实现与详细解释
  • CRYPT32!CryptMsgUpdate函数分析和asn.1 editor nt5inf.cat 的总览信息
  • 机器学习回顾——逻辑回归
  • Consul 操作命令汇总 - Prometheus服务注册
  • 计算机视觉与深度学习 | 视觉里程计技术全景解析:从原理到前沿应用
  • 2024年09月 Python(四级)真题解析#中国电子学会#全国青少年软件编程等级考试
  • 项目一系列-第8章 性能优化Redis基础
  • 星链调查(SOS)线上问卷调查:全流程标准化实践与核心优势深挖
  • 第三届机械工程与先进制造智能化技术研讨会(MEAMIT2025)
  • 【NJU-OS-JYY笔记】操作系统:设计与实现
  • 锂电池充电芯片 XSP30支持PD/QC等多种快充协议支持最大充电电流2A
  • Origin绘制四元相图
  • [Linux]学习笔记系列 -- mm/shrinker.c 内核缓存收缩器(Kernel Cache Shrinker) 响应内存压力的回调机制
  • 深入解析PCIe 6.0拓扑架构:从根复合体到端点的完整连接体系