当前位置: 首页 > backend >正文

AI大模型学习三十二、飞桨AI studio 部署 免费Qwen3-235B与Qwen3-32B,并导入dify应用

一、说明

Qwen3-235B 和 Qwen3-32B 的主要区别在于它们的参数规模和应用场景。

参数规模

  • Qwen3-235B‌:总参数量为2350亿,激活参数量为220亿‌。
  • Qwen3-32B‌:总参数量为320亿‌。

应用场景

  • Qwen3-235B‌:作为旗舰模型,Qwen3-235B在复杂任务中表现出色,特别是在代码、数学和通用能力等基准测试中,与 DeepSeek-R1 、 o1 、 o3-mini 、 Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果‌。
  • Qwen3-32B‌:适合中大型任务,适合普通的企业级部署‌。

性能表现

  • Qwen3-235B‌:在处理复杂任务时表现出色,能够提供高性能的推理结果‌。
  • Qwen3-32B‌:虽然参数规模较小,但在实际使用中也能提供良好的性能表现‌。

二、飞桨AI studio部署模型

1、注册飞桨

飞桨AI Studio星河社区-人工智能学习与实训社区https://aistudio.baidu.com/overview具体步骤不写了

2、部署模型

部署 Qwen/Qwen3-235B-A22B

 

同样方法可以部署Qwen/Qwen3-32B

同时只能部署一个,部署之前我们要停止运行的模型

 

  

三、创建dify应用,引入模型

1、安装插件OpenAI-API-compatible

详细步骤我们不说,安装后在这里找到插件

 2、导入模型

 

 

点击保存后

 

同样我们也可以添加Qwen3-235B-A22B的模型 

注意飞桨同时只能打开一个模型,没交钱的情况下

需要关闭32b,然后运行235b模型,然后再配置

Qwen3-235B-A22B不太好用,慢,可能是资源问题,毕竟免费啊

3、创建应用

 

4、测试(Qwen/Qwen3-235B-A22B)

 

5、测试(Qwen/Qwen3-32B)

速度快了很多

 

时间上有问题,所以还需要处理,这个自己看吧,毕竟这些模型并不是实时的,是以前的数据, 

http://www.xdnf.cn/news/12084.html

相关文章:

  • CSS 选择器全解析:分组选择器/嵌套选择器,从基础到高级
  • 关于如何运用AI的思考
  • Day44 Python打卡训练营
  • ATM存取钱项目
  • 【DeepSeek 学大模型推理】Fused Residual LayerNorm with Reduce-Scatter
  • MySQL事务:从ACID特性到高并发优化的深度解析
  • day 44
  • K8S主机漏洞扫描时检测到kube-服务目标SSL证书已过期漏洞的一种永久性修复方法
  • 【论文写作】如何撰写基于模型拼接(A+B)的创新性论文
  • leetcode 二叉搜索树中第k小的元素 java
  • SiFli 567+emmc Standby休眠报错问题
  • 重装系统+驱动+磁盘分区
  • day19 leetcode-hot100-37(二叉树2)
  • 5.29-6.4解决问题归纳
  • 银行用户信誉等级
  • 前端面试宝典---vite原理解析
  • Numpy——结构化数组和Numpy文件
  • 【电赛培训课程】电子设计竞赛工程基础知识
  • 使用qt 定义全局钩子 捕获系统的键盘事件
  • 《人性的弱点》核心总结
  • AI基础认知
  • 【Python连接数据库基础 06】Pandas与SQL协同:解锁大规模数据处理新境界,让分析效率飙升10倍
  • 代理IP:6G标准化进程中的隐形推手
  • 如何在 React 中监听 div 的滚动事件
  • Pendulum:优雅处理 Python 中的日期与时间
  • vue3动态插入iframe,内容被取消的原因
  • pack 布局管理器
  • 第十三节:第三部分:集合框架:Map集合的遍历方式
  • 数码相片冲印规格参考表
  • Docker load 后镜像名称为空问题的解决方案