当前位置: 首页 > news >正文

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

来源 | 量子位

编程Agent王座,国产开源模型拿下了!

就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——

不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。

图片

网友当即实测了一把小球弹跳,效果是酱婶的:

图片

效果之强,甚至引来惊呼:简直改变游戏规则。

图片

毕竟,这可是开源免费的!

现在大家不用再每月花200刀买Claude Code了!

图片

Qwen3-Coder包括多个尺寸,其中最强版本Qwen3-Coder-480B-A35B-Instruct是450B的MoE模型,激活参数为35B

原生支持256K上下文,还可以通过YaRN扩展到1M长度。

图片

命令行版Qwen也同步登场:

通义团队基于Gemini Code,进行了prompt和工具调用协议适配,二次开发并开源命令行工具Qwen Code

嗯,这年头每个CLI都不好意思说自己是编程Agent了(doge)。

简单prompt直出酷炫效果

Qwen3-Coder具体表现如何,还是直接眼见为实。

基本上是,使用简单的语言就能得到惊喜的体验:

比如一句话实现用p5js创建多彩的可交互动画。

图片

3D地球可视化,分分钟得到一个电子地球仪。

图片

还能做出动态的天气卡片。

图片

可交互的小游戏也能轻松拿捏。

图片

我们也简单实测了一波,先来个最实用的功能——做简历。

提示词是:生成一个可编辑的简历模板。

图片

写个扫雷游戏更是轻轻松松,即写即玩~

提示词:生成一个扫雷游戏。

图片

效果之外,值得关注的是,这一次通义团队同样公布了从预训练到后训练的不少技术细节。

技术细节

预训练阶段,Qwen3-Coder主要还是从不同角度进行Scaling,以提升模型能力。

包括数据扩展、上下文扩展、合成数据扩展

其训练数据的规模达到7.5Ttokens,其中70%为代码数据,在保证通用与数学能力的同时提高了编程能力。

同时,原生支持256K上下文长度,借助YaRN技术可以扩展至1M,适配仓库级和动态数据处理。

在训练中还利用Qwen2.5-Coder对低质量数据进行了清洗与重写,显著提升了整体数据的质量。

与当前热衷于竞赛类编程的模型不同,Qwen团队认为代码任务天然适合执行驱动的大规模强化学习。

因此在后训练阶段,他们一方面通过Scaling Code RL在丰富、真实的代码任务上扩展训练,自动生成多样化测试用例,提高了代码执行的成功率。

图片

另一方面,引入了Scaling Long-Horizon RL,依托阿里云基础设施构建可以同时运行20000个独立环境的系统,让模型在多轮交互中表现优异,尤其是在SWE-bench Verified上实现了开源模型SOTA的效果。

图片

开源 vs 闭源

看到这里,你是不是也摩拳擦掌想要一试Qwen3-Coder的真实实力了?

帮大家指个路:

  • 最简单的,可以直接在Qwen官网体验;

  • 命令行安装Qwen Code,支持OpenAI SDK调用LLM;

  • 在阿里云百炼平台申请API,Claude Code、Cline等编程工具都能搭配起来用。

值得一提的是,Qwen3-Coder依然遵循的是Apache License Version 2.0,商用友好。

反正开源嘛,主动权已经交到了各位开发者手里~

而这也是Qwen此番发布,引得网友刷屏转发的关键所在:

Qwen3-Coder看起来是开源编程Agent的一次重大飞越。

图片

现在是比肩,超越还会远吗?

图片

而更令人兴奋的是,在开源这条路上,中国模型们当之无愧地正走在最前列。

官网:
https://chat.qwen.ai/
项目地址:
https://github.com/QwenLM/qwen-code
参考链接:
https://mp.weixin.qq.com/s/CArpTOknOQC5O90Wgih3SA

http://www.xdnf.cn/news/1179523.html

相关文章:

  • SQL基础⑪ | 约束
  • 基于ABC与BP神经网络分类模型的特征选择方法研究(Python实现)
  • 制造业新突破:AR 培训系统助力复杂操作轻松上手​
  • Linux服务器安全自动化审计实战:一键扫描账户/网络/进程/计划任务风险(附开源脚本)
  • 数据库期中复习
  • 【Guava】1.1.我的报告
  • 进程调度的艺术:从概念本质到 Linux 内核实现
  • Windows 10 远程桌面(RDP)防暴力破解脚本
  • 用python自动标注word试题选项注意事项
  • 安全逆向工程学习路线
  • 4.1.2 XmlInclude 在 C# 中的作用及示例
  • 【Unity开发】数据存储——XML
  • web:js函数的prototype(原型对象)属性
  • Opentrons 模块化平台与AI技术助力智能移液创新,赋能AAW™自动化工作站
  • 电商项目_秒杀_架构升级
  • YOLOv4深度解析:革命性的实时目标检测技术
  • 报告研读——103页数据资产价值实现研究报告( 2023)【附全文阅读】
  • 【ECharts✨】解决Vue 中 v-show 导致组件 ECharts 样式异常问题
  • PAT 甲级题目讲解:1003《Emergency》
  • Apache Commons:Java开发者的瑞士军刀
  • C语言第四章函数
  • Perf编译和使用
  • kettle插件-kettle数据挖掘ARFF插件
  • 2025年7月23日 AI 今日头条
  • 【已解决】YOLO11模型转wts时报错:PytorchStreamReader failed reading zip archive
  • C++实现精确延时的方法
  • 鸿蒙平台运行Lua脚本
  • 论文阅读:《无约束多目标优化的遗传算法,群体和进化计算》
  • 【Word Press进阶】自定义区块的行为与样式
  • Linux(centos7)安装 docker + ollama+ deepseek-r1:7b + Open WebUI(内含一键安装脚本)