当前位置：首页 > java >正文

vllm安装注意事项[nccl、cuda、python相关]

java 2025/6/28 0:09:03

1、前言

我们在使用vllm进行大模型并发推理时，逃不开vllm的安装，现对vllm安装时的坑说明下

2、python版本要求

上图展示了vllm各版本与python版本的对应关系，可自行查看，当然如果你选择了py310，就没问题。

3、NCCL版本

NCCL是多机多卡通信的程序库，与cuda也是有版本对应关系的，实践发现通常安装vllm失败是nccl版本低导致的，现经过实践整理对应关系如下：

nccl 2.20.5 安装 vllm 0.6.0 可行
nccl 2.21.5 安装 vllm 0.8.5 不可行

nccl版本可通过如下方式查看：

import torch
print(torch.cuda.nccl.version())

输入格式为：（2, 20, 5）表示你的nccl版本是2.20.5，安装0.6.0版本的vllm是没问题的，直接通过pip安装即可：

pip install vllm==0.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

那么对于nccl版本低导致vllm无法安装的情况，有两种解决方案：

1）对于方便更新nccl的情况，直接更新下软件包的版本即可

2）不方便更新时，可拉取vllm最新版本的docker镜像实现

对于高版本的vllm，如0.8.5，qwen3要求的最低vllm版本是0.8.5才能分布式部署，对于0.6.0版本的vllm，则可部署qwen2.5，根据自己的实际需求安装即可。

查看全文

http://www.xdnf.cn/news/12148.html

七彩喜智慧养老平台：科技赋能下的市场蓝海，满足多样化养老服务需求

spring官方脚手架连接不上解决方案

语雀文档保存失败URI malformed

v1.0.1版本更新·2025年5月22日发布-优雅草星云物联网AI智控系统

YAML在自动化测试中的三大核心作用

SSL/TLS握手全流程拆解：从“Hello“到“安全通道“的每一个字节

高性能分布式消息队列系统（四）

Spring Boot 常用注解面试题深度解析

重磅更新！基于Gemini 2.5 Pro打造的AI智能体PlantUML-X上线！

Vue3入门指南：从零到精通的快速上手

CppCon 2015 学习:CLANG/C2 for Windows

c++的引用

26考研 | 王道 | 计算机组成原理 | 三、存储系统

数据质量是什么意思？怎样做好数据质量监控？

【Flask】：轻量级Python Web框架详解

解决ts报错找不到vue组件，Module “d:src/views/quota/logicpoolinfo/components/add

stm32_GPIO

63、.NET 异常处理

Honor of Kings 2025.06.05

如何自定义一个 Spring Boot Starter？

手撕 K-Means

20250605车充安服务器受木马攻击导致服务不可用

【SSM】SpringBoot学习笔记1：SpringBoot快速入门

02 Deep learning神经网络的编程基础逻辑回归--吴恩达

ES6中的Map与Set数据结构的简单应用

如何轻松将视频从安卓设备传输到电脑？

QT开发技术【ffmpeg + QAudioOutput】音乐播放器完善

Struts2漏洞由浅入深

Python数据类型与运算符全解析-Python数据挖掘可视化分析

DASCTF

1、前言

2、python版本要求

3、NCCL版本

相关文章：