当前位置: 首页 > web >正文

【GPT入门】第40课 vllm与ollama特性对比,与模型部署

【GPT入门】第40课 vllm与ollama特性对比,与模型部署

  • 1.两种部署
  • 1.1 vllm与ollama特性对比
  • 2. vllm部署
    • 2.1 服务器准备
    • 2.1 下载模型
    • 2.2 提供模型服务

1.两种部署

1.1 vllm与ollama特性对比

在这里插入图片描述
在这里插入图片描述

2. vllm部署

2.1 服务器准备

在autodl 等大模型服务器提供商,采购一个
在这里插入图片描述

2.1 下载模型

pip install modelscope
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B --local_dir /ai/data/DeepSeek-R1-Distill-Qwen-1.5B

2.2 提供模型服务

root@autodl-container-9f7a4caa9b-14e615df:~# python -m venv vllm
root@autodl-container-9f7a4caa9b-14e615df:~# source vllm/bin/activate
(vllm) root@autodl-container-9f7a4caa9b-14e615df:~# pip install vllmvllm serve  /ai/data/DeepSeek-R1-Distill-Qwen-1.5B

在这里插入图片描述
在这里插入图片描述

http://www.xdnf.cn/news/10452.html

相关文章:

  • wsl安装linux
  • 测试总结(二)
  • Python 验证码识别(使用pytesseract库)
  • JVM——JVM运行时数据区的内部机制是怎样的?
  • unix/linux source 命令,在当前的 Shell 会话中读取并执行指定文件中的命令
  • 【AI学习】检索增强生成(Retrieval Augmented Generation,RAG)
  • Vue拖拽组件:vue-draggable-plus
  • 神经网络与Transformer详解
  • Ansible 剧本精粹 - 编写你的第一个 Playbook
  • Spring Boot 4.0实战:构建高并发电商系统
  • 通过内核寄存器排除HardFault
  • uni-app学习笔记十七-css和scss的使用
  • 振动力学:无阻尼单自由度系统
  • 【数据结构】顺序表和链表详解(上)
  • 图文详解Java并发面试题
  • 基于Canvas实现抽奖转盘
  • 打打基础 | 从翻转链表到寄存器、汇编与内存
  • 智慧新基建数字孪生,绘就桥梁运维新画卷
  • 【STM32F407 PWM配置和应用指南 】
  • [yolov11改进系列]基于yolov11引入上下文锚点注意力CAA的python源码+训练源码
  • Spring Boot中的事件与JMS消息集成
  • Windows搭建Swift语言编译环境?如何构建ObjC语言编译环境?Swift如何引入ObjC框架?Interface Builder的历史?
  • 【论文复现】水下单光子激光雷达设计 Sequential Multimodal Underwater Single
  • PySide6 GUI 学习笔记——常用类及控件使用方法(地址类QUrl)
  • Vert.x学习笔记-EventLoop与Context的关系
  • 图像处理篇---face_recognition库实现人脸检测
  • Linux系统之gettext详解
  • Excel to JSON 插件 2.4.0 版本更新
  • 【java面试】redis篇
  • 【Linux系统】第八节—进程概念(上)—冯诺依曼体系结构+操作系统+进程及进程状态+僵尸进程—详解!