当前位置: 首页 > news >正文

mac m1安装大模型工具vllm

1 更新系统环境

参考vllm官网文档,vllm对apple m1平台mac os, xcoder, clang有如下要求

OS: macOS Sonoma or later

SDK: XCode 15.4 or later with Command Line Tools

Compiler: Apple Clang >= 15.0.0

在App Store更新macOS和XCoder,依据XCoder版本号安装command line tools。

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

 2 安装anconda并初始化虚拟环境

下载并安装apple m1版本anconda

比如 Anaconda3-2025.06-0-MacOSX-arm64.pkg

https://www.anaconda.com/download-success

初始化conda虚拟环境

conda create -n vllm python=3.12

conda activate vllm

3 安装vllm

1)下载vllm

git clone https://github.com/vllm-project/vllm.git

大部分情况git clone会失败,所以直接下载vllm的release版本,这里下载0.92,链接如下。

https://github.com/vllm-project/vllm/releases/download/v0.9.2/vllm-0.9.2.tar.gz

https://github.com/vllm-project/vllm/releases

2)安装vllm

先安装依赖

cd vllm

pip install -r requirements/cpu.txt

conda install cmake

conda install ninja

再安装vllm

pip install -e .

需注意的是以上操作要在mac自带终端下完成,在iterm下会遇到编译问题。

4 验证vllm

vLLM 将 Hugging Face 模型下载到本地,默认 ~/cache/huggingface/hub 文件夹中。

以下是测试代码。

import osos.environ["HF_ENDPOINT"] = "https://hf-mirror.com"from vllm.entrypoints.llm import LLM
from vllm.sampling_params import SamplingParamsmodel_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"llm = LLM(model=model_name, max_model_len=128)sampling_params = SamplingParams(temperature = 0.9,max_tokens = 100)
prompt = "中国首都在那?"
output = llm.generate(prompt, sampling_params)print(output)
print(output[0].outputs[0].text)

另外,vLLM 还可以作为服务运行。

目前存在的问题是运行慢,后续看看有效的量化方法。

reference

---

vllm

https://github.com/vllm-project/vllm.git

vllm CPU install doc

https://docs.vllm.ai/en/latest/getting_started/installation/cpu.html

mac command line tools

https://developer.apple.com/download/all/?q=Command%20Line%20Tools

小白入门:使用vLLM在本机MAC上部署大模型

https://www.53ai.com/news/OpenSourceLLM/2025040116542.html

hf-mirror

https://hf-mirror.com/

http://www.xdnf.cn/news/1090837.html

相关文章:

  • 迁移Oracle SH 示例 schema 到 PostgreSQL
  • 双指针-15.三数之和-力扣(LeetCode)
  • 算法核心知识复习:排序算法对比 + 递归与递推深度解析(根据GESP四级题目总结)
  • Oracle 数据库升级踩坑:DBLink ORA-02019 问题解决思路
  • 使用 Docker 搭建 Rust Web 应用开发环境——AI教你学Docker
  • 工程改Mvvm
  • 一天一道Sql题(day04)
  • 基于lottie的微信小程序动画开发指南
  • CSS中的Element语法
  • 仓颉语言 1.0.0 升级指南:工具链适配、collection 操作重构与 Map 遍历删除避坑
  • ali linux 安装libreoffice
  • 《重构项目》基于Apollo架构设计的项目重构方案(多种地图、多阶段、多任务、状态机管理)
  • Context Engineering:从Prompt Engineering到上下文工程的演进
  • Ragas的Prompt Object
  • 微软 Bluetooth LE Explorer 实用工具的详细使用分析
  • JVM字节码加载与存储中的细节
  • 川翔云电脑:突破硬件极限,重构设计生产力范式
  • 【vim中替换】
  • 【自动驾驶】经典LSS算法解析——深度估计
  • BEV感知算法:自动驾驶的“上帝视角“革命
  • django 一个表中包括id和parentid,如何通过parentid找到全部父爷id
  • 免费扫描软件NAPS2:跨平台支持 旋转裁剪 + 多页合并,纸质文档变 PDF / 图片
  • 详解Kafka重平衡机制详解
  • Python(30)基于itertools生成器的量子计算模拟技术深度解析
  • 18-C#改变形参内容
  • 《设计模式之禅》笔记摘录 - 5.代理模式
  • AI应用实践:制作一个支持超长计算公式的计算器,计算内容只包含加减乘除算法,保存在一个HTML文件中
  • 设计模式(行为型)-责任链模式
  • Flink Forward Asia 2025 主旨演讲精彩回顾
  • 两张图片对比clip功能