当前位置：首页 > ops >正文

vllm docker-compose 运行LLM-Research/Mistral-7B-Instruct-v0.3

ops 2025/6/20 18:07:00

下载模型

modelscope download --model LLM-Research/Mistral-7B-Instruct-v0.3 --cache_dir e:\ai\vllm\models\Research

运行,运行本地模型，设置环境变量
HF_HUB_OFFLINE: 1

services: vllm-Research:container_name: vllm-Researchrestart: noimage: vllm/vllm-openai:latestruntime: nvidiaipc: host	 environment:TZ: Asia/Shanghai HF_HUB_OFFLINE: 1CUDA_VISIBLE_DEVICES： 0volumes: - e:\ai\vllm\models\Research:/modelscommand: ["--model", "/models/LLM-Research/Mistral-7B-Instruct-v0___3","--served_model_name", "LLM-Research/Mistral-7B-Instruct-v0.3","--gpu_memory_utilization", "0.90","--max_model_len", "672 ","--tensor-parallel-size", "1"]ports:- 8002:8000deploy:resources:reservations:devices:- driver: nvidiacapabilities: [ gpu ]count: all

http://www.xdnf.cn/news/13329.html

相关文章：

Linux 杀进程指令详解：`kill -9 PID` 和 `kill -15 PID` 有什么区别？

服务器上传或者下载在中间断网后继续上传方法

【软考中级】软件设计师考试大纲

新闻类鸿蒙应用功耗危机以及优化方案

Java反射完全指南

高频面试之5Kafka

Mac 上使用 mysql -u root -p 命令，出现“zsh: command not found: mysql“?如何解决

机器人教学和实践的可编程智能仿生机器人平台——智能六足机器人

【Java开发】Spring 事务开发完全指南：从入门到精通

MySQL中触发器详解触发器在自动化任务中的应用场景

第27节 Node.js Buffer

【编译工具】（自动化）AI 赋能的自动化测试工具：如何让测试效率提升 500% 并实现智能质检？

UML用例分析与用例规约表：以聊天室软件为例

Odoo 17 在线聊天报错 “Couldn‘t bind the websocket...“ 的解决方案

gitHub hexo 个人博客升级版

springboot + nacos + k8s 优雅停机

Go 通道（Channel）入门与基础使用

P2842 纸币问题 1

SpringBoot + 自建GitLab + Jenkins + CentOS Stream 9 来实现自动化部署

商品中心—3.商品可采可补可售的技术文档上

Mybatis辅助配置-配置SQL提示

2024 CKS题库+详尽解析| 1. kube-bench 修复不安全项

提取 Word 中图片原始质量

浅谈HDFS--基本操作

进程信号之signal系统调用

【编译工具】（自动化）自动化测试工具：如何让我的开发效率提升300%并保证代码质量？

UniApp APP打包方法（Android/iOS双平台）

SQL进阶之旅 Day 26：分库分表环境中的SQL策略

三数之和-力扣

BUUCTF两道目录包含题目