当前位置: 首页 > news >正文

安装AI高性能推理框架llama.cpp

基础知识:llama.cpp是什么?

1.下载安装包

通过git下载主干源代码:

git clone --progress --branch master -v "https://github.com/ggml-org/llama.cpp.git" "./llama.cpp"

也可以下载tag源码,例如,下载【Source code [zip]】文件:

https://github.com/ggml-org/llama.cpp/releases/tag/b6123

2.执行编译安装

1)安装前准备

(1)安装前需确认是否已安装curl开发库。执行以下命令,确认curl开发库是否已安装?

  • Ubuntu/Debian
# 检查头文件是否存在
ls /usr/include/x86_64-linux-gnu/curl/curl.h
  • CentOS/RHEL
# 检查头文件是否存在
ls /usr/include/curl/curl.h

如果文件不存在,则说明curl开发库还没有安装好,需要执行以下命令进行安装:

  • Ubuntu/Debian
sudo apt update
sudo apt install libcurl4-openssl-dev  # 或 libcurl4-gnutls-dev
  • CentOS/RHEL
sudo yum install -y libcurl-devel

(2)确认是否支持ccache?

执行以下命令确认是否支持ccache:

ccache --version

如果提示命令不存在,执行以下命令进行安装:

  • Ubuntu/Debian
sudo apt update
sudo apt install ccache
  • CentOS/RHEL
sudo yum install -y ccache

(3)创建编译目录

把下载的离线安装解压后,进入到llama.cpp目录,执行以下命令创建build子目录:

mkdir build

2)编译前检查

再进入build子目录,执行以下命令进行编译安装:

cd build          # 进入构建目录
cmake ..          # 生成构建系统(Makefile)

根据提示解决相关的库依赖问题(由于不同的环境预安装的库存在差异,因此,这里不再一一详细说明)。

3)执行编译命令

执行以下命令进行编译:

make GGML_CUDA=1  # 编译项目,并支持CUDA加速版编译,如果没有nvidia的网卡和CUDA库,请直接使用不带参数的 make 命令。

编译过程会需要些时间,请耐心等候。出现以下提示表示

4)执行安装命令

make install      # 安装

3.验证安装效果

执行以下命令,验证安装效果:

llama-cli --version

如果提示以下信息,表示已安装成功

 如果提示以下信息,则说明要更新系统的动态链接库。

llama-cli: error while loading shared libraries: libllama.so: cannot open shared object file: No such file or directory

更新系统的动态链接库的方法如下:

sudo ldconfig

然后验证更新后的效果:

ldconfig -p | grep libllama

返回以下信息,表示更新成功:

此时,再执行llama-cli --version命令即可看到正确的返回结果了。

http://www.xdnf.cn/news/1281745.html

相关文章:

  • AR 智能眼镜:从入门到未来
  • 5G与云计算对代理IP行业的深远影响
  • Unknown collation: ‘utf8mb4_0900_ai_ci‘
  • ROS2学习(1)—基础概念及环境搭建
  • FinQ4Cn: 基于 MCP 协议的中国 A 股量化分析
  • P2865 [USACO06NOV] Roadblocks G
  • 第2节 PyTorch加载数据
  • 3.数据类型和类型装换
  • 爬虫和数据分析相结合案例
  • 安全合规4--下一代防火墙组网
  • 强化学习常用数据集
  • 【11-计算机视觉介绍】
  • RAG所存在的问题和解决方案
  • 贪心----3. 跳跃游戏 II
  • 2438. 二的幂数组中查询范围内的乘积
  • 零基础AI编程开发微信小程序赚流量主广告实战
  • MySQL高可用改造之数据库开发规范(大事务与数据一致性篇)
  • Kubernetes生产环境健康检查自动化指南
  • SQL复杂查询
  • Java AI生成长篇小说的实用
  • 基于大数据的个性化学习环境构建的研究与应用
  • Flutter Provider 状态管理全面解析与实战应用:从入门到精通
  • libwebsockets 服务端获取过代理的真实连接IP
  • 重学React(五):脱围机制一
  • 使用Windbg分析多线程死锁项目实战问题分享
  • 金蝶云星空 × SRM 深度集成实战(附完整接口清单)
  • 两个Maven工程,使用idea开发,工程A中依赖了工程B,改了工程B,工程A如何获取最新代码
  • Java学习 -- 可变参数与Collections工具类
  • 基于数据结构用java实现二叉树的排序器
  • Java项目基本流程(三)