当前位置: 首页 > ops >正文

vllm docker-compose 运行LLM-Research/Mistral-7B-Instruct-v0.3

下载模型

modelscope download --model LLM-Research/Mistral-7B-Instruct-v0.3 --cache_dir e:\ai\vllm\models\Research  

运行,运行本地模型,设置环境变量
HF_HUB_OFFLINE: 1

services: vllm-Research:container_name: vllm-Researchrestart: noimage: vllm/vllm-openai:latestruntime: nvidiaipc: host	 environment:TZ: Asia/Shanghai HF_HUB_OFFLINE: 1CUDA_VISIBLE_DEVICES: 0volumes: - e:\ai\vllm\models\Research:/modelscommand: ["--model", "/models/LLM-Research/Mistral-7B-Instruct-v0___3","--served_model_name", "LLM-Research/Mistral-7B-Instruct-v0.3","--gpu_memory_utilization", "0.90","--max_model_len", "672 ","--tensor-parallel-size", "1"]ports:- 8002:8000deploy:resources:reservations:devices:- driver: nvidiacapabilities: [ gpu ]count: all             
http://www.xdnf.cn/news/13329.html

相关文章:

  • Linux 杀进程指令详解:`kill -9 PID` 和 `kill -15 PID` 有什么区别?
  • 服务器上传或者下载在中间断网后继续上传方法
  • 【软考中级】软件设计师考试大纲
  • 新闻类鸿蒙应用功耗危机以及优化方案
  • Java反射完全指南
  • 高频面试之5Kafka
  • Mac 上使用 mysql -u root -p 命令,出现“zsh: command not found: mysql“?如何解决
  • 机器人教学和实践的可编程智能仿生机器人平台——智能六足机器人
  • 【Java开发】Spring 事务开发完全指南:从入门到精通
  • MySQL中触发器详解 触发器在自动化任务中的应用场景
  • 第27节 Node.js Buffer
  • 【编译工具】(自动化)AI 赋能的自动化测试工具:如何让测试效率提升 500% 并实现智能质检?
  • UML用例分析与用例规约表:以聊天室软件为例
  • Odoo 17 在线聊天报错 “Couldn‘t bind the websocket...“ 的解决方案
  • gitHub hexo 个人博客升级版
  • springboot + nacos + k8s 优雅停机
  • Go 通道(Channel)入门与基础使用
  • P2842 纸币问题 1
  • SpringBoot + 自建GitLab + Jenkins + CentOS Stream 9 来实现自动化部署
  • 商品中心—3.商品可采可补可售的技术文档上
  • Mybatis辅助配置-配置SQL提示
  • 2024 CKS题库+详尽解析| 1. kube-bench 修复不安全项
  • 提取 Word 中图片原始质量
  • 浅谈HDFS--基本操作
  • 进程信号之signal系统调用
  • 【编译工具】(自动化)自动化测试工具:如何让我的开发效率提升300%并保证代码质量?
  • UniApp APP打包方法(Android/iOS双平台)
  • SQL进阶之旅 Day 26:分库分表环境中的SQL策略
  • 三数之和-力扣
  • BUUCTF两道目录包含题目