当前位置: 首页 > news >正文

美团开源龙猫大模型,与DeepSeek V3同一梯队?

目录

前言

一、“龙猫”是谁?一个既能干又会省的“专家团队”

二、“龙猫”的独门绝技:让AI学会“摸鱼”和走“快速通道”

三、不光会省,更能打:看看“龙猫”的成绩单

四、关键问题:美团,一家“外卖公司”,为什么非要自己做大模型?

结语:当“龙猫”跑起来,AI不再遥远


🎬 攻城狮7号:个人主页

🔥 个人专栏:《AI前沿技术要闻》

⛺️ 君子慎独!

 🌈 大家好,欢迎来访我的博客!
⛳️ 此篇文章主要介绍 美团开源龙猫大模型
📚 本期文章收录在《AI前沿技术要闻》,大家有兴趣可以自行查看!
⛺️ 欢迎各位 ✔️ 点赞 👍 收藏 ⭐留言 📝!

前言

        2025年夏末,当大多数人对美团的印象还停留在准时的外卖、方便的单车和酒店预订时,这家公司悄悄地向科技圈扔下了一颗“重磅炸弹”——他们开源了自家研发的AI大模型,取名“龙猫”(LongCat-Flash-Chat)。

        一时间,圈内议论纷纷。一个送外卖的,怎么突然就搞出了一个在多项技术指标上能和全球顶尖模型掰手腕的AI?这感觉就像是你家楼下最熟悉的快餐店,突然有一天宣布他们研发出了米其林三星级别的分子料理,而且还把配方免费公开了。

        这事儿透着一股魔幻现实主义的味道,但它确实发生了。美团的“龙猫”不仅来了,而且来势汹汹。它不仅仅是一个技术成果的展示,更像是美团这家看似传统的互联网巨头,对其未来十年发展方向的一次高调宣言。今天,我们就来深入浅出地聊一聊,这只“龙猫”到底是什么,它厉害在哪,以及更重要的——美团为什么要做这件事?

一、“龙猫”是谁?一个既能干又会省的“专家团队”

        首先,我们得搞明白“龙猫”是个什么东西。简单来说,它是一个语言大模型,和你我熟知的ChatGPT、文心一言是同类。你可以跟它对话,让它写代码、写文章、做翻译、解答问题。

        但“龙猫”的特别之处在于它的“工作方式”。

        传统的大模型,有点像一个无所不知的“全科医生”,不管你问什么问题,他都要调动全身所有的知识储备来回答你。这导致了一个问题:算力消耗巨大。就像你只是问一句“今天天气怎么样”,他却把气象学、地理学、物理学的所有知识都在脑子里过了一遍,成本太高了。

        而“龙猫”采用了一种更聪明的架构,叫做“混合专家模型”(Mixture of Experts, MoE)。你可以把它想象成一个“专家医院”。这家医院里没有全科医生,而是一个个顶尖的“专科大夫”,有的擅长数学,有的擅长编程,有的擅长文学。当你提出一个问题时,系统会像一个聪明的“导诊台”,迅速判断你的问题属于哪个领域,然后只激活那一小部分最相关的“专家”来为你服务。

        这样一来,模型的总参数量可以做得非常大(“龙猫”有5600亿),意味着它的知识储备极其丰富,潜力巨大。但在解决具体问题时,它只需要激活一小部分参数(平均约270亿),大大降低了能耗和计算成本。

二、“龙猫”的独门绝技:让AI学会“摸鱼”和走“快速通道”

        若说MoE架构是“龙猫”的核心理念,其落地靠两大绝技:

         一是“零计算专家”,堪称“聪明的摸鱼”。它能识别“的”“了”、标点等无复杂信息的简单内容,不做复杂计算,直接返回输入,把算力用在关键处,避免浪费。

        二是“快捷连接混合专家模型(ScMoE)”,解决“通信延迟”瓶颈。通过架构设计建立“快速通道”,让数据传输与计算并行处理,提升团队“沟通效率”。

        凭借这两大绝技,“龙猫”实现100+ tokens/s的推理速度,成本仅每百万字0.7美元,兼顾顶尖性能与高效性价比。

三、不光会省,更能打:看看“龙猫”的成绩单

        聊了这么多技术,最终还是要看实际表现。“龙猫”的成绩单可以说相当亮眼,尤其是在几个关键领域:

        (1)“听话”能力(指令遵循)超群:这是“龙猫”最突出的亮点。在IFEval和COLLIE这类专门评估模型能否理解并执行复杂、多步骤指令的测试中,“龙猫”的得分超过了包括DeepSeek-V3.1在内的众多顶尖模型,名列前茅。这意味着它不是一个只会聊天的“书呆子”,而是一个能理解你复杂意图并付诸行动的“靠谱助理”。

        (2)智能体(Agent)任务表现突出:所谓“Agent”,就是能调用工具、与环境交互来完成任务的AI。比如你让它“帮我查一下明天去上海的机票,并找一家评分最高的酒店”,它需要调用查询工具、分析数据、做出决策。在这类测试中,“龙猫”同样表现出色,在一些高复杂度场景中得分位列第一。这预示着它在未来自动化办公、智能助理等领域的巨大潜力。

        (3)编程能力不俗:在编程任务上,“龙猫”的表现可以和被誉为“编程之王”的Claude 4 Sonnet打个平手。对于一个非专门为编程优化的模型来说,这已经是非常了不起的成就。

        (4)通用知识和中文能力扎实:在MMLU(衡量综合知识水平)和CEval(衡量中文能力)等基础测试中,“龙猫”的得分也稳居第一梯队,证明其基础非常扎实。

        总的来说,“龙猫”是一个没有明显短板,并且在“执行和应用”层面有着突出优势的“实干派”模型。

四、关键问题:美团,一家“外卖公司”,为什么非要自己做大模型?

        这可能是大家最关心的问题。一个靠本地生活服务起家的公司,为什么要投入数十亿的真金白银,去啃AI基础模型这块最硬的骨头?答案就藏在美团CEO王兴的“主动进攻”四个字里。

        王兴认为,面对AI这样颠覆性的技术浪潮,防守是毫无意义的,唯一的策略就是“利用自身所拥有的一切资源去主动进攻”。美团的AI战略,可以看作一个三层架构:

        第一层:用AI武装自己(AI at Work)。美团有超过10万名员工,利用AI工具提升内部工作效率,比如AI辅助编程、智能会议、文档助手等,可以直接降本增效。

        第二层:用AI改造业务(AI in Products)。将AI深度融合到现有的产品中。想象一下,未来的美团App,可能有一个超级智能的助手,能根据你的口味、预算和当前位置,为你规划一整天的吃喝玩乐行程,并自动完成预订。这能极大地提升用户体验和平台价值。

        第三层:掌握AI的核心能力(Building LLM)。这就是“龙猫”诞生的原因。美团深知,如果AI是未来的“电”,那么基础大模型就是“发电厂”。把核心技术掌握在自己手里,有几个显而易见的好处:

        (1)成本可控:长期来看,依赖外部模型API的成本是巨大的。自研模型可以将成本降到最低,尤其是在美团海量的用户和业务场景下。

        (2)深度定制:只有自己掌握了模型,才能根据自身业务(如外卖、酒旅、零售)的独特数据和需求,进行最深入的优化和定制,打造出最贴合场景的AI能力。

        (3)数据安全:将核心数据掌握在自己手中,是任何一家科技巨头的生命线。

        (4)连接数字与物理世界:这是美团最大的野心。美团的业务根植于真实的物理世界——餐厅、商店、骑手、无人配送车。王兴的目标是“实体AI”(Physical AI)。“龙日志”作为大脑,可以指挥无人机、机器人完成配送,优化城市物流网络。美团近年投资了30多家机器人公司,正是这一战略的体现。它要做的,是让AI走出屏幕,真正在现实世界里“跑起来”。

        所以,做“龙猫”对美团来说,不是一道选择题,而是一道必答题。它不是为了追赶时髦,而是为了构筑未来十年最坚固的护城河。

结语:当“龙猫”跑起来,AI不再遥远

        美团“龙猫”的发布,给我们带来了几点深刻的启示:

        首先,AI大模型的竞争正从“军备竞赛”式的参数比拼,转向更加注重“效率和应用”的务实阶段。谁能用更低的成本,解决更实际的问题,谁就能在商业化浪潮中胜出。

        其次,AI正在以前所未有的速度渗透到各行各业。未来,最成功的AI公司,可能不是那些纯粹的技术提供商,而是像美团这样,能将AI与自身强大业务场景深度结合的“产业玩家”。

        最后,对于我们普通人来说,像“龙猫”这样高性能模型的开源,意味着AI应用的门槛被大大降低。一个充满创意的小团队,也能借助这些强大的工具,开发出令人惊艳的应用。

        这只来自“外卖公司”的“龙猫”,或许真的能像宫崎骏动画里的龙猫一样,为我们打开一扇通往全新世界的大门。在这个世界里,AI不再是实验室里遥不可及的黑科技,而是像外卖一样,触手可及、服务于我们每个人的日常生活。

试用地址:https://longcat.chat
huggingface:https://huggingface.co/meituan-longcat/LongCat-Flash-Chat
github:https://github.com/meituan-longcat/LongCat-Flash-Chat
x/twitter:https://x.com/Meituan_LongCat/status/1961827385667690965

看到这里了还不给博主点一个:
⛳️ 点赞☀️收藏 ⭐️ 关注

💛 💙 💜 ❤️ 💚💓 💗 💕 💞 💘 💖
再次感谢大家的支持!
你们的点赞就是博主更新最大的动力!

http://www.xdnf.cn/news/1454329.html

相关文章:

  • matlab实现希尔伯特变换(HHT)
  • vue2 打包生成的js文件过大优化
  • 白平衡分块统计数据为什么需要向下采样?
  • Web应用安全入门:从OWASP Top 10理解SQL注入与纵深防御
  • GcWord V8.2 新版本:TOA/TA字段增强、模板标签管理与PDF导出优化
  • 政务级数据安全!小陌GEO引擎的私有化部署实践指南
  • 机器学习 - 使用 ID3 算法从原理到实际举例理解决策树
  • 【开题答辩全过程】以宠物应急救援平台为例,包含答辩的问题和答案
  • 视频增强AI哪个效果好?实战对比帮你找到最适合的工具
  • 【Python基础】 14 Rust 与 Python 标识符命名规则与风格对比笔记
  • 中值滤波、方框滤波、高斯滤波、均值滤波、膨胀、腐蚀、开运算、闭运算
  • 2025年数学建模国赛C题超详细解题思路
  • [免费]基于Python的Django+Vue图书借阅推荐系统【论文+源码+SQL脚本】
  • 设计模式最佳实践 - 模板模式 + 责任链模式
  • PyTorch 学习率调度器(LR Scheduler)
  • HTB Sau
  • MySQL数据库和SQL语言
  • 具身智能多模态感知与场景理解:多模态3D场景理解
  • Linux基础知识(一)
  • AGX Orin平台RTC驱动导致reboot系统卡住问题调试
  • 微信小程序-day4
  • 微信小程序日历事件添加实现
  • IO_HW_9_4
  • 基于飞算JavaAI的学生成绩综合统计分析系统
  • Android Zygote 源码剖析
  • webpack scope hositing 和tree shaking
  • 谷歌修复安卓120个漏洞,含两个正遭利用的零日漏洞
  • 一文吃透 C#中异步编程Task
  • 鸿蒙权限崩溃:网络文件访问全攻略
  • CentOS系统如何查看当前内存容量