当前位置：首页 > backend >正文

阿里通义千问 Qwen3 系列模型正式发布，该模型有哪些技术亮点？

backend 2025/7/5 4:27:24

从混合专家（MoE）架构到会思考的动态推理，再到完全开源的Apache2.0许可证，Qwen3的发布，预示着开源AI正在加速追赶。

这次阿里一口气发了8款模型，包括2款MoE模型和6款不同尺寸的密集模型。其中最大的亮点就是MoE架构的应用。简单来说，就是在模型里有配一个专家库，处理不同的任务时，让最了解任务的几位专家出来回答，这样做能降低计算成本。

以最大的Qwen3-235B-A22B为例，虽然总参数大，但实际运行时只激活了很小一部分，据说用训练一个两三百亿参数模型的资源就能跑起来。以前需要砸重金配算力才能运行的模型，现在门槛一下子低了不少，甚至有消息称只需要四块英伟达H20芯片就能部署完整版，显存占用率也降低到DeepSeek-R1的三分之一，这对开发者和中小企业来说是个好消息。

http://www.xdnf.cn/news/6935.html

相关文章：

pytorch小记（二十一）：PyTorch 中的 torch.randn 全面指南

WebAuthn开发常见问题及解决方案汇总：多语言支持、依赖管理与安全验证实践

Android同屏采集并推送RTMP和启动轻量级RTSP服务技术实践

QT之LayOut布局

SVGPlay：一次 CodeBuddy 主动构建的动画工具之旅

GO语言学习（三）

项目管理学习-CSPM-4考试总结

VC++6.0分步执行常见问题及解决方案

阿里云国际站与国内站的核心布局与本土化服务的选择

Linux中的进程

提示词工程框架：CoT、ToT、GoT、PoT（链式提示）

MySQL 索引优化以及慢查询优化

Linux面试题集合（2）

20250517 我设想一个空间，无限大，空间不与其中物质进行任何作用，甚至这个空间能容纳可以伸缩的空间

【技巧】GoogleChrome浏览器开发者模式查看dify接口

Day119 | 灵神 | 二叉树 | 二叉树的最近共公共祖先

C43-指针与数组

[已解决] LaTeX “Unicode character“ 报错 (中文字符处理)

MySQL高可用架构

深入解析Spring Boot与Spring Security的集成实践

游戏详情制作（Navigation组件）

语音合成终身免费畅用！[特殊字符] 紧急提醒：禁用更新锁死权限！

电脑桌面便签软件哪个好用？好用便签Windows版下载推荐

大麦（Hordeum vulgare）中 BAHD 超家族酰基转移酶-文献精读129

关于Android Studio for Platform的使用记录

2025最新的软件测试面试大全（含答案+文档）

系统架构设计（十）：结构化编程

Linux线程同步信号量

hbuilderX 安装Prettier格式化代码

哈希的原理、实现