lxd 容器内的深度学习服务器环境配置
文章目录
- lxd 容器内的深度学习服务器环境配置
- 前言
- 配置容器软件源
- 设置 pip 清华源
- 安装容器显卡驱动
- 安装 CUDA
- 安装 miniconda
- 安装 pytorch
lxd 容器内的深度学习服务器环境配置
前言
lxd 是一个多用户容器,各个容器之间互不干扰,但宿主机的环境配置和容器内的环境配置过程略有不同,此处记录经过验证的 lxd 容器内深度学习服务器环境配置过程。
配置容器软件源
备份原来的源:
sudo mv /etc/apt/sources.list /etc/apt/sources.list.bak
将源的内容设置为清华镜像:
sudo apt install vim
sudo rm /etc/apt/sources.list
sudo vim /etc/apt/sources.list
将其中内容改为:
# 默认注释了源码镜像以提高 apt update 速度,如有需要可自行取消注释
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-security main restricted universe multiverse# 预发布软件源,不建议启用
# deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ jammy-proposed main restricted universe multiverse 作者:贝拉的海 https://www.bilibili.com/read/cv17891624?spm_id_from=333.999.0.0 出处:bilibili
更新软件列表:
sudo apt update
sudo apt upgrade
设置 pip 清华源
sudo apt install python3-pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
安装容器显卡驱动
容器显卡驱动需与宿主机相同,此处宿主机的显卡驱动为 NVIDIA-Linux-x86_64-550.90.07.run
,输入以下命令安装显卡驱动:
sudo bash ./NVIDIA-Linux-x86_64-550.90.07.run --no-kernel-module
安装 CUDA
本次安装使用的 CUDA 版本是 sudo sh cuda_12.0.1_525.85.12_linux.run
:
sudo sh cuda_12.0.1_525.85.12_linux.run
不要勾选第一个安装显卡驱动( driver )的,因为之前已经安装过了:
安装完成后提示:
配置环境变量:
vim ~/.bashrc
再文件最后加入以下语句(如果安装的事别的版本的 CUDA,此处的 CUDA_HOME
要进行对于修改):
export CUDA_HOME=/usr/local/cuda-11.8
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
然后使其生效:
source ~/.bashrc
使用命令 nvcc -V
查看安装的版本信息:
安装 miniconda
miniconda 下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/,本次使用的 miniconda 版本是 Miniconda3-py312_25.5.1-0-Linux-x86_64.sh
。
安装 miniconda :
sudo bash ./Miniconda3-py312_25.5.1-0-Linux-x86_64.sh
安装 pytorch
创建虚拟环境并进入虚拟环境:
conda create --name pytorch python=3.12 # 创建名为 pytorch 的虚拟环境,指定 Python 版本为 3.12
安装命令详见官网:https://pytorch.org/,并根据 CUDA 版本安装 pytorch ,此处是基于 CUDA 11.8 安装的 pytorch:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
在命令号中输入 Python ,验证 pytorch 调用 GPU:
import torch
torch.cuda.is_available()