当前位置: 首页 > java >正文

vllm安装注意事项[nccl、cuda、python相关]

1、前言

        我们在使用vllm进行大模型并发推理时,逃不开vllm的安装,现对vllm安装时的坑说明下

2、python版本要求

        上图展示了vllm各版本与python版本的对应关系,可自行查看,当然如果你选择了py310,就没问题。

3、NCCL版本

        NCCL是多机多卡通信的程序库,与cuda也是有版本对应关系的,实践发现通常安装vllm失败是nccl版本低导致的,现经过实践整理对应关系如下:

        nccl 2.20.5 安装 vllm  0.6.0 可行
        nccl 2.21.5 安装 vllm  0.8.5 不可行

        nccl版本可通过如下方式查看:

import torch
print(torch.cuda.nccl.version())

        输入格式为:(2, 20, 5)表示你的nccl版本是2.20.5,安装0.6.0版本的vllm是没问题的,直接通过pip安装即可:

pip install vllm==0.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

        那么对于nccl版本低导致vllm无法安装的情况,有两种解决方案:

        1)对于方便更新nccl的情况,直接更新下软件包的版本即可

        2)不方便更新时,可拉取vllm最新版本的docker镜像实现

        对于高版本的vllm,如0.8.5,qwen3要求的最低vllm版本是0.8.5才能分布式部署,对于0.6.0版本的vllm,则可部署qwen2.5,根据自己的实际需求安装即可。

http://www.xdnf.cn/news/12148.html

相关文章:

  • 七彩喜智慧养老平台:科技赋能下的市场蓝海,满足多样化养老服务需求
  • spring官方脚手架连接不上解决方案
  • 语雀文档保存失败URI malformed
  • v1.0.1版本更新·2025年5月22日发布-优雅草星云物联网AI智控系统
  • YAML在自动化测试中的三大核心作用
  • SSL/TLS握手全流程拆解:从“Hello“到“安全通道“的每一个字节
  • 高性能分布式消息队列系统(四)
  • Spring Boot 常用注解面试题深度解析
  • 重磅更新! 基于Gemini 2.5 Pro打造的AI智能体PlantUML-X上线!
  • Vue3入门指南:从零到精通的快速上手
  • CppCon 2015 学习:CLANG/C2 for Windows
  • c++的引用
  • 26考研 | 王道 | 计算机组成原理 | 三、存储系统
  • 数据质量是什么意思?怎样做好数据质量监控?
  • 【Flask】:轻量级Python Web框架详解
  • 解决ts报错找不到vue组件,Module “d:src/views/quota/logicpoolinfo/components/add
  • stm32_GPIO
  • 63、.NET 异常处理
  • Honor of Kings 2025.06.05
  • 如何自定义一个 Spring Boot Starter?
  • 手撕 K-Means
  • 20250605车充安服务器受木马攻击导致服务不可用
  • 【SSM】SpringBoot学习笔记1:SpringBoot快速入门
  • 02 Deep learning神经网络的编程基础 逻辑回归--吴恩达
  • ES6中的Map与Set数据结构的简单应用
  • 如何轻松将视频从安卓设备传输到电脑?
  • QT开发技术【ffmpeg + QAudioOutput】音乐播放器 完善
  • Struts2漏洞由浅入深
  • Python数据类型与运算符全解析-Python数据挖掘可视化分析
  • DASCTF