当前位置: 首页 > news >正文

almalinux9.6-4070显卡-ollama-qwen2.5-7b

目录

1.NVIDIA显卡驱动以及CUDA安装

2.docker安装以及镜像拉取

3.创建ollama及open-webui容器

4.配置open-webui连接ollama


本方法同样适用于和rhel8和rhel9

系统版本

1.NVIDIA显卡驱动以及CUDA安装

编辑/usr/lib/modprobe.d/dist-blacklist.conf文件,这一步是为了阻止系统加载 Nouveau(NVIDIA开源驱动)

blacklist nvidiafb加#号注释掉

添加如下内容

blacklist nouveau
options nouveau modest=0

修改后之后使用命令移除Nouveau,并进行重启

#移除nouveau
rmmod nouveau

重启之后,使用命令安装一下驱动所需依赖(在此之前也可以用 dnf update -y 升级一下已有软件包)

#uname -r命令的作用是查看系统内核版本,在命令中代表安装对应内核版本的kernel-devel以及kernel-headers
dnf install gcc kernel-devel-$(uname -r) kernel-headers-$(uname -r) make elfutils-libelf-devel tar bzip2  acpid wget -y

依赖安装完成后,我们需要下载NVIDIA显卡驱动

下载地址为:

NVIDIA GeForce 驱动程序 - N 卡驱动 | NVIDIAhttps://www.nvidia.cn/geforce/drivers/根据显卡型号以及系统型号选择驱动,点击开始搜索

有多个版本可供选择,我这里直接下载最新的,点击获取下载

下载好之后通过STFP上传到服务器,给可执行权限后进行安装

#给驱动添加可执行权限,*代表驱动版本
chmod +x NVIDIA-Linux-x86_64-*.run
#执行驱动安装
./NVIDIA-Linux-x86_64-*.run

这里是问你装专用驱动还是开源驱动,建议是专用驱动NVIDIA Proprietary

这里是问是否需要下载32位兼容性库,一般来说用不上,选择NO即可

这条提示是在问你是否要运行 nvidia-xconfig 工具自动更新 X 配置文件,建议选 Yes,工具会自动调整配置,让电脑重启图形界面后,用 NVIDIA 驱动渲染画面;同时会备份原来的 X 配置文件,不用担心原配置丢失。要是选 No,就得自己手动改 X 配置文件,否则 NVIDIA 驱动可能没法正常接管图形输出,比如重启后分辨率异常、显卡没启用等。

安装好了之后,用命令查看显卡信息

#查看显卡信息命令
nvidia-smi

驱动安装之后我们开始安装CUDA,驱动版本不同我们安装的CUDA版本也不同,如上图命令输出就可以看到575版本的显卡驱动(右上角的CUDA Version),建议CUDA12.9

我们到CUDA官方,网址为:

CUDA Toolkit 12.9 Update 1 Downloads | NVIDIA Developerhttps://developer.nvidia.com/cuda-downloads选择系统版本(almalinux以及rockylinux都是rhel;版本8.*就选Version 8,版本9.*就选Version 9)以及安装方式,我这里还是选择rpm(local)下载到本地安装

选好之后,会给我们对应的安装命令,按照官方给出的命令输入即可(这里使用了wget命令,如果没有安装使用 dnf install wget -y 进行安装即可)

安装截图如下

安装好之后,我们还需要修改一下环境变量,编辑文件/etc/profile,添加以下内容

export PATH=$PATH:/usr/local/cuda/bin  
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

保存好之后,用命令重新加载一下环境变量配置文件

#重新加载环境变量配置文件
source /etc/profile

使用命令即可查看到CUDA的版本信息

#查看CUDA版本信息
nvcc -V

2.docker安装以及镜像拉取

首先我们需要添加一下docker的软件源,然后再开始安装,命令为

#安装yum-utils工具
dnf install -y yum-utils
#添加阿里云镜像站的docker软件源
yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/rhel/docker-ce.repo
#安装docker
dnf install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin -y

安装好之后,我们启动docker,并设置docker服务自启动,命令为

#启动docker
systemctl start docker
#设置docker服务自启动
systemctl enable docker

这个时候,docker已经好了,但是不配置加速器的情况下,我们无法拉取docker镜像,我们编辑文件 /etc/docker/daemon.json,将内容修改为:

{"registry-mirrors": ["https://dockerpull.pw"]
}

修改后我们需要重启docker

#重启docker
systemctl restart docker

加速器配置之后,我们还有一个事情要做,正常情况下docker无法调用gpu的,我们需要安装NVIDIA容器支持包才可以让docker调用GPU,首先我们先添加NVIDIA容器包的软件源,再进行安装

#添加NVIDIA容器支持包的软件源
curl -s -L https://nvidia.github.io/libnvidia-container/stable/rpm/nvidia-container-toolkit.repo \| sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
#安装NVIDIA容器支持包
dnf install -y nvidia-container-toolkit

安装好了,配置一下命令让docker能够使用NVIDIA的GPU,然后重启docker

#让 Docker 容器能够访问和使用宿主机上的 NVIDIA GPU 资源 
nvidia-ctk runtime configure --runtime=docker
#重启docker
systemctl restart docker

配置工作都做完了,我们开始拉取Ollama以及OpenWebUI镜像

#拉取ollama镜像
docker pull ollama/ollama
#拉取openwebui镜像
docker pull ghcr.io/open-webui/open-webui:main
#如果openwebui卡顿,换成国内源
docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/ghcr.io/open-webui/open-webui:v0.6.9

3.创建ollama及open-webui容器

创建ollama的文件夹,用于docker文件夹映射

#创建ollama文件夹
mkdir /root/ollama
#创建并启动ollama的容器
docker run -d --gpus=all -v /root/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

用ollama下载并启动qwen2.5-7b

#到ollama容器启动ollama run qwen2.5:7b命令(意思是下载并启动qwen2.5-7b模型)
docker exec -it ollama ollama run qwen2.5:7b

模型启动成功后,我们开始docker部署open-webui

#创建open-webui文件夹
mkdir /root/open-webui
#创建并启动open-webui的容器(如果镜像是ghcr.io/open-webui/open-webui:main那么命令就是docker run -d -p 3000:8080 --gpus all -v /root/open-webui:/app/backend/data --name open-webui  ghcr.io/open-webui/open-webui:main)
docker run -d -p 3000:8080 --gpus all -v /root/open-webui:/app/backend/data --name open-webui swr.cn-north-4.myhuaweicloud.com/ddn-k8s/ghcr.io/open-webui/open-webui:v0.6.9

关闭防火墙和selinux

#关闭防火墙
systemctl stop firewalld
#关闭selinux
setenforce 0

4.配置open-webui连接ollama

进入 http://服务器IP:3000 页面,点击开始使用

创建用户,信息请自行填写,然后点击创建管理员账号

点击左下角的用户名,然后点击管理员面板

点击左上角的设置-外部连接-ollama API,然后找到齿轮设置,修改URL为 http://服务器IP:11434,然后点击保存

点击左上角的新对话,即可进入文本输入界面,可以看到我们ollama跑的qwen2.5-7B模型;正常输入获取回复,到这一步基于almalinux9.6的ollama部署qwen2.5-7B就完成了

http://www.xdnf.cn/news/1189729.html

相关文章:

  • rt-thread 5.2.1 基于at-start-f437开发过程记录
  • Python 面向对象基础
  • 力扣刷题(第九十九天)
  • Rust嵌入式开发实战
  • 去除视频字幕 4 : 下一步,打算研究 Video Inpainting (视频修复):
  • Redis 缓存机制详解:原理、问题与最佳实践
  • Effective C++ 条款4:确定对象被使用前已先被初始化
  • 编程与数学 03-002 计算机网络 06_网络层职责
  • 设计模式十一:享元模式(Flyweight Pattern)
  • 路由选择工具——IP-Prefix
  • 如何查看电脑后门IP和流量?
  • 变频器实习DAY15
  • Kafka MQ 消费者应用场景
  • 机器人仿真(2)Ubuntu24.04下RTX5090配置IsaacSim与IsaacLab
  • 推荐系统(第三课第二周)
  • 【AcWing 143题解】最大异或对
  • Item14:在资源管理类中小心拷贝行为
  • 高并发微服务限流算法方案对比与实践指南
  • xLua和C#交互
  • 激光雷达-相机标定工具:支持普通相机和鱼眼相机的交互式标定
  • 字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
  • 6.数组和字符串
  • J2EE模式---表现层集成模式
  • 备份一下我的 mac mini 的环境变量配置情况
  • net-snmp添加自定义mib树
  • 【C++基础】指针常量 | 常量指针 | int* p | const int* p | int* const p| const int* const p
  • 详解力扣高频SQL50题之619. 只出现一次的最大数字【简单】
  • PCIe 的L状态(链路状态)和D状态(设备状态)
  • 前端组件梳理
  • 【WPF】NumericUpDown的用法