当前位置: 首页 > java >正文

vllm server返回404的一种可能得解决方案

我的 server 启动指令

CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7  PYTHONPATH=${PYTHONPATH}:/root/experiments/vllm vllm serve ./models/DeepSeek-V3-awq --tensor-parallel-size 8 --trust-remote-code  --disable-log-requests --load-format dummy --port 8040 

client 端访访问后,server端返回:
在这里插入图片描述
就很奇怪,不都是直接访问 /v1/completions 这个路径吗?咋能404呢?

哦,原来是模型路径填错了

python benchmark_client.py \--backend vllm \--num_prompts 3000 \--warmup_round 1 \--concurrency 256 \--host localhost \--port 8000 \--model_name /test/models/DeepSeek-V3-awq      # <---------

启动server的时候写的是相对路径,这里写成绝对路径了
benchmark_client.py 这里是我的测试脚本,你看看你的请求头里的模型名字/路径改对了吗

http://www.xdnf.cn/news/9312.html

相关文章:

  • 怎么查找idea插件的下载位置,并更改
  • 牛客周赛Round93
  • vue+threeJs 设置模型默认的旋转角度
  • 应用层协议http(无代码版)
  • element的el-table翻页选中功能
  • 《重塑认知:Django MVT架构的多维剖析与实践》
  • #RabbitMQ# 消息队列进阶
  • yolo最终笔记
  • 《棒球特长生》棒球升学途径·棒球1号位
  • 梯度消失和梯度爆炸的原因及解决办法
  • torch cuda 版本安装
  • Java 各版本核心新特性的详细说明
  • 2025软考软件设计师题目
  • 【CATIA的二次开发12】根对象Application的Documents集合概述
  • IEEE出版|2025人工智能驱动图像处理与计算机视觉技术国际学术研讨会 (AIPCVT 2025)
  • MobaXterm连接Docker Desktop中的容器(shell)
  • 人脸识别打卡项目
  • MySQL问题:什么是MySQL的中的最左匹配原则?
  • RY2200 One Cell Li-ion and Li-poly Battery Protection IC
  • 【运维实战】Linux 内存调优之进程内存深度监控
  • 基于深度学习双塔模型的食堂菜品推荐系统
  • 【MQTT】TLS证书双向验证
  • 天大《电视原理》背诵考点整理+计算/框图/作业题 (个人整理)
  • FPGA中的“BPI“指什么
  • 软件项目交付阶段,验收报告记录了什么?有哪些标准要求?
  • centos7.5安装kubernetes1.25.0
  • 随叫随到的电力补给:移动充电服务如何重塑用户体验?
  • cursor-stats 实时监控 Cursor IDE 的使用情况和订阅状态
  • 线代第四章线性方程组第三节:齐次线性方程组
  • JDK21深度解密 Day 7:FFM与VarHandle底层剖析