【笔记】NVIDIA AI Workbench 中安装 CUDA 12.9
安装 NVIDIA AI Workbench 之后 ,我们还得到一个WSL-Linux子系统,如果想利用该子系统进行深度学习等尝试,就需要为其搭建深度学习环境,以下是从CUDA开始的记录,关于在该子系统中进行 Anaconda 的安装请查看往期笔记。该子系统与其他WSL子系统的前期配置稍有不同,需要额外的sudo权限和密码的配置操作(见文内参考资料)。以下是完整的CUDA 12.9安装过程:
一、前置条件
(一)安装 NVIDIA AI Workbench
【笔记】NVIDIA AI Workbench 安装记录-CSDN博客
(二)配置 sudo 权限(密码)
【笔记】NVIDIA AI Workbench 中 sudo 密码问题排查与解决-CSDN博客
Windows系统中的PowerShell中执行:
wsl -u root -d NVIDIA-Workbench
passwd workbench
usermod -aG sudo workbench
groups workbench
su - workbench
以下是针对这些命令的详细注释,帮助我们理解每个步骤的目的:
# 在 Windows 系统的 PowerShell 中执行以下命令# 使用 WSL (Windows Subsystem for Linux) 以 root 用户身份登录到名为 NVIDIA-Workbench 的发行版
# 这允许您绕过普通用户的权限限制,直接进行系统级更改
wsl -u root -d NVIDIA-Workbench# 设置或重置 workbench 用户的密码
# 在提示输入新 UNIX 密码时,请输入并确认一个新密码
passwd workbench# 将 workbench 用户添加到 sudo 组中
# 这赋予了 workbench 用户使用 sudo 执行需要管理员权限的命令的能力
usermod -aG sudo workbench# 查看 workbench 用户所属的所有组
# 应该包括 'sudo' 组,表明用户现在拥有 sudo 权限
groups workbench# 切换到 workbench 用户
# 需要输入之前设置的 workbench 用户密码来完成切换
su - workbench
二、安装 CUDA 12.9
(一)打开NVIDIA-Workbench
(二)验证与系统GPU的连通性
nvidia-smi
(三)安装 CUDA
1、 确定CUDA的安装命令
在CUDA 官网如下图如示确定安装命令:
CUDA Toolkit 12.9 Update 1 Downloads | NVIDIA Developer
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-9
2、执行安装
复制命令粘贴到窗口执行安装:
3、配置环境变量
安装完成后,需要设置相应的环境变量以便系统能找到 CUDA 库和头文件。
(1)编辑 .bashrc
文件
打开 .bashrc
文件,命令:
nano ~/.bashrc
(2)按键盘上的 ↑ ↓ 箭头移动在文件末尾添加以下内容:
复制过去粘贴
# 设置 CUDA 路径
export PATH=/usr/local/cuda-12.9/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.9/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存并退出编辑器(按 Ctrl+X
,然后按 Y
确认保存,最后按 Enter
)。
(3)使更改生效
source ~/.bashrc
(四)验证 CUDA 是否正确安装:
nvcc --version# 或者
nvcc -V
如果显示了 CUDA 编译器版本信息,则说明安装成功。
安装完成后同样会生成一些组件的快捷图标:
三、安装CUDA驱动程序
(一)检查驱动程序是否正常
安装完CUDA12.9后会发现nvcc -V命令输出已经正确,但我们安装前验证过的nvidia-smi命令此时已经输出异常:
(二)获取安装命令
此时我们需要安装CUDA官方提供的驱动程序:
#Driver Installer
#NVIDIA Driver Instructions (choose one option)#To install the open kernel module flavor:
sudo apt-get install -y nvidia-open#To install the proprietary kernel module flavor:
sudo apt-get install -y cuda-drivers
(三)关于命令的选择
关于命令的选择请参考我之前的文章,因篇幅有限,恕在此不再赘述
简而言之是如果不熟悉的话,推荐第1条命令(更新快、支持好);如果想更好的兼容CUDA则可用第2条命令。无论选哪条命令都几乎不影响功能的使用。
第二章、第(一)段 中的 第 7 节
在WSL2-Ubuntu中安装CUDA12.8、cuDNN、Anaconda、Pytorch并验证安装_cuda 12.8 pytorch版本-CSDN博客
(四)安装驱动程序
sudo apt-get install -y nvidia-open
或者:
sudo apt-get install -y cuda-drivers
(五)再次验证 nvidia-smi 命令:
安装完成后再次验证 nvidia-smi 命令:
nvidia-smi
五、总结与后续步骤
(一)安装完成标志:
1、 nvcc -V 正确显示版本号。
2、 nvidia-smi 无报错。
3、 环境变量已写入 .bashrc,并通过 source 生效。
(二)下一步操作:
1、安装 cuDNN 9.10.2(现已无需登录 NVIDIA 开发者账号)。
2、配置深度学习框架(如 PyTorch、TensorFlow),验证 GPU 加速功能(见后续笔记)。