当前位置: 首页 > backend >正文

如何本地部署Qwen3系列的大小模型235B/32B并进行推理服务及并发测试?

环境:

Ubuntu20.04

Qwen3-30B-A3B-AWQ

Qwen3-32B-Int4-W4A16

Qwen3-32B-FP8

Qwen3-235B-A22B-AWQ

H20 95Gx2

vllm 0.8.5

问题描述:

如何本地部署Qwen3系列的大小模型235B/32B并进行推理服务及并发测试?

在这里插入图片描述

解决方案:

1.按需新建模型相关文件夹

mkdir Qwen3
chmod 777 /mnt/program/Qwen3

2.配置conda源

nano ~/.condarc

nano /root/miniconda/.condarc

channels:- http
http://www.xdnf.cn/news/7151.html

相关文章:

  • 力扣1991:找到数组的中间位置(前缀和)
  • 三、关系数据库
  • leetcode报错原因总结需要背下来的程序片 [更新中]
  • MinIO:从入门到精通,解锁云原生存储的奥秘
  • 程序代码篇---python向http界面发送数据
  • Ubuntu搭建TFTP服务器的方法
  • OpenCL C++图像纹理处理
  • jvm安全点(四)openjdk17 c++源码垃圾回收之安全点轮询页内存设置不可访问
  • 前端图片上传组件实战:从动态销毁Input到全屏预览的全功能实现
  • 备份C#的两个类
  • 【DAY22】 复习日
  • 三、高级攻击工具与框架
  • React Flow 边的基础知识与示例:从基本属性到代码实例详解
  • 飞机飞行控制系统补偿模型辨识报告
  • HarmonyOS AVPlayer 音频播放器
  • 【2025软考高级架构师】——2022年11月份真题与解析
  • 【方法论】如何构建金字塔框架
  • C++ for QWidget:connect(连接)
  • C++ asio网络编程(8)处理粘包问题
  • Java IO及Netty框架学习小结
  • 学习黑客 http 响应头
  • Spark 基础自定义分区器
  • 游戏:英雄联盟游戏开发代码(谢苏)
  • 互联网大厂Java面试场景:从简单到复杂的技术深度解析
  • Java注解篇:@CrossOrigin
  • 鸿蒙AI开发:10-多模态大模型与原子化服务的集成
  • 大学之大:墨西哥国立自治大学2025.5.18
  • STM32项目实战:ADC采集
  • [原创工具] 小说写作软件
  • java springMVC+MyBatis项目1,服务端处理json,RequestBody注解,Form表单发送,JavaScript发送