当前位置：首页 > news >正文

Qwen3大模型本地部署及Python调用指南

news 2025/5/31 20:30:36

1 简介

阿里开源的Qwen3系列大模型全线发布：

其模型能力，按照官方的介绍，直接对标DeepSeek-R1、o1、o3-mini、Grok-3、Gemini-2.5-Pro等顶级大模型，在代码、数学、通用能力等基准测试中表现十分优异，成为开源大模型领域新的翘楚：

今天的文章中，我们就来介绍如何快速完成对Qwen3系列模型的本地部署，并通过Python快捷调用模型进行推理。

2 Qwen3系列模型的本地部署

Qwen3系列模型支持常见的各种主流部署工具，如SGLang、vLLM、Ollama、LMStudio、llama.cpp等，我们以其中使用起来最为方便的Ollama为例（注意Ollama版本需要大于等于0.6.6）：

访问Ollama官网中的Qwen3模型主页（ https://ollama.com/library/qwen3 ），可以看到众多参数类型的可用模型：

根据你的硬件算力，选择合适参数量的模型及量化版本，我的显卡是4090，显存达到24G，因此最大可运行32B参数量的模型，以Qwen3系列模型中官方着重介绍的MOE模型qwen3:30b-a3b为例：

拉取模型文件

ollama run qwen3:30b-a3b

ollama终端中临时运行模型

ollama run qwen3:30b-a3b --verbose

加载qwen3:30b-a3b模型对应的显存占用情况：

模型推理速度参考：

非思考模式

值得一提的是，Qwen3系列模型支持关闭思考模式，我们可以在实际任务中，针对较简单场景省去思考的过程，直接输出内容，降低推理耗时（在输入的问题末尾添加/no_think即可）：

3 通过Python调用本地部署的Qwen3模型

在上文基础上，接下来我们进一步展示如何在Python中高效调用已部署的本地Qwen3模型：

3.1 常规内容生成及对话任务

最直接的方式，我们可以使用Ollama官方的Python库来快捷实现常规对话：

安装ollama库

pip install ollama

列出可用模型

文本生成任务

文本生成任务（关闭思考）

对话任务

对话任务（流式）

3.2 Agent任务

Qwen3系列模型支持函数调用，我们可以基于它快速开发各种智能体功能，以我常用的pydantic-ai为例：

安装pydantic-ai相关最小依赖库

pip install "pydantic-ai-slim[openai]"

基于pydantic-ai快速构建智能体

在pydantic-ai中，我们可以直接使用兼容openai模型的形式，对接已通过Ollama部署的模型，非常的高效方便😉，：

更多参考资料：

https://ollama.com/library/qwen3
https://github.com/ollama/ollama-python
https://ai.pydantic.dev/
https://github.com/pydantic/pydantic-ai

以上就是本文的全部内容，欢迎在评论区与我们进行讨论~

查看全文

http://www.xdnf.cn/news/692425.html

数据库管理-第330期数据库国产化可以顺便做的事情（20250528）

SpringBoot使用ffmpeg实现视频压缩

大模型应用开发第五讲：成熟度模型：从ChatGPT（L2）到未来自主Agent（L4）

服务器开机自启动服务

css设置动态数值：clamp函数

Tailwind CSS 实战，基于 Kooboo 构建 AI 对话框页面（三）：实现暗黑模式主题切换

kubernate解决 “cni0“ already has an IP address different from 10.244.0.1/24问题

FastAPI 依赖注入

c++第二章练习题

Java数值字符串相加

英飞凌SBC芯片TLE9263QX for STM32的库函数与使用

⭐️⭐️⭐️ 免费的AI Clouder认证 ⭐️⭐️⭐️ 第四弹【课时1：课程概览】for「大模型Clouder认证：基于通义灵码实现高效AI编码」

企业信息管理系统的设计与实现(代码+数据库+LW)

【多线程初阶】初识线程创建线程

线性回归中标准方程法求逆失败的解法：正则化

三维点云深度学习代码torch-points3d-SiamKPConvVariants复现记录（持续更新中）

Gerapy二次开发：在Ubuntu服务器中利用pyenv+supervisor实现项目部署

为 MCP Server 提供 Auth 认证，及 Django 实现示例

三、zookeeper 常用shell命令

Spring AI 代理模式（Agent Agentic Patterns）

基于Vue3.0的【Vis.js】库基本使用教程（002）：图片知识图谱的基本构建和设置

机器学习-随机森林

算法训练第一天

深度解析 torch.mean 的替代方案

Web前端快速入门（Vue、Element、Nginx)

通过海康萤石API控制家里相机的云台及抓图

1 简介

2 Qwen3系列模型的本地部署

3 通过Python调用本地部署的Qwen3模型

3.1 常规内容生成及对话任务

3.2 Agent任务

相关文章：