当前位置: 首页 > backend >正文

linux CUDA与CUDNN安装教程

目录

1.CUDA安装

1.1.CUDA作用

1.2.CUDA下载

1.3.CUDA安装 

1.4.验证

2.CUDNN安装

2.1.CUDNN作用

2.2.下载  

2.3.安装 

2.4.验证


1.CUDA安装

1.1.CUDA作用

       CUDA 是 NVIDIA 提供的并行计算平台和编程模型,允许开发者直接利用 GPU 的并行计算能力,而无需编写底层图形API(如OpenGL)。通过扩展 C/C++/Python 等语言,CUDA 使得开发者可以编写直接在 GPU 上运行的代码(称为核函数),适用于任何需要大规模并行计算的任务,如科学模拟、图像处理、深度学习等。

1.2.CUDA下载

查看CUDA驱动:

nvidia-smi

显示如下:

CUDA version12.4表示当前驱动最多支持到 CUDA Toolkit 12.4,但通常也向下兼容更低的 CUDA Toolkit 版本。

NVIDIA 驱动通常支持 所有 ≤ 驱动标称版本 的 CUDA Toolkit。例如:

驱动版本 12.4 → 支持 CUDA Toolkit 12.x、11.x、10.x 等。

但具体兼容范围需参考 NVIDIA 官方文档。

 为了omega-ai项目更好的兼容性,我们这里安装CUDA 11.7版本,地址:CUDA Toolkit 11.7 Downloads | NVIDIA Developer

注意:如果机器已经有12.4的CUDA Tookit了,不影响本次11.7的安装,可以安装多个版本。

wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run

1.3.CUDA安装 

执行linux命令安装:

sudo sh cuda_11.7.0_515.43.04_linux.run

 第一步:输入accept,回车

 第二步:选择drive,回车,取消驱动安装,再选择install安装

 显示如下安装成功:

 查看安装日志:

cat /var/log/cuda-installer.log

遇到 "Cannot find manpages to install" 的警告或错误,通常是因为CUDA安装包缺少manpages(手册页)文件,或者安装程序无法找到它们。如果不需要查阅CUDAman手册,可以直接忽略此警告。我们这里忽略 !如果你确实需要查阅CUDA的man手册,你可以在此https://developer.download.nvidia.cn/compute/cuda/redist/cuda_documentation/linux-x86_64/下载相同版本的documentation安装。

1.4.验证

nvcc --version  # 查看 CUDA 编译器版本

 如下说明安装成功:

2.CUDNN安装

2.1.CUDNN作用

       cuDNN 是 NVIDIA 针对深度学习优化的高性能库,基于 CUDA 构建,提供了高度优化的常见深度学习操作实现。针对卷积(Convolution)、池化(Pooling)、归一化(BatchNorm)、激活函数(ReLU等)、循环神经网络(RNN/LSTM)等操作进行了极致优化,显著提升训练和推理速度。主流深度学习框架(如 TensorFlow、PyTorch)依赖 cuDNN 作为底层计算引擎。

2.2.下载  

Index of /compute/cudnn/redist/cudnn/linux-x86_64

2.3.安装 


tar -xvf cudnn-linux-x86_64-9.10.0.56_cuda11-archive.tar.xz
cd cudnn-linux-x86_64-9.10.0.56_cuda11-archive
sudo cp -r include/* /usr/local/cuda-11.7/include/
sudo cp -r lib/* /usr/local/cuda-11.7/lib64/

2.4.验证

        进入 CUDA 的安装目录(默认路径如/usr/local/cuda-11.7),分别进入include和lib文件夹,查看是否存在以cudnn开头的文件,如cudnn.h和cudnn.lib等。也可以运行 CUDA 安装目录下extra\demo_suite文件夹中的deviceQuery和bandwidthTest文件 ,在命令行中进入该文件夹目录,然后依次执行以下命令:

./deviceQuery
./bandwidthTest

 若两个程序的输出结果中都出现Result = PASS,则说明 cuDNN 安装和配置正确。

http://www.xdnf.cn/news/5743.html

相关文章:

  • OrangePi Zero 3学习笔记(Android篇)7 - ftdi_sio
  • Spring框架(二)
  • 2025年渗透测试面试题总结-渗透测试红队面试八(题目+回答)
  • 使用 Kyverno 验证 Kubernetes 容器镜像:实用指南
  • AUTOSAR图解==>AUTOSAR_TR_AIMeasurementCalibrationDiagnostics
  • 软考 系统架构设计师系列知识点之杂项集萃(57)
  • IIS URL静态化 伪静态组件ISAPI_Rewrite安装配置 伪静态不生效解决办法 避坑版
  • 音视频学习:使用NDK编译FFmpeg动态库
  • 【002】renPy android端启动流程分析
  • 主播美颜API常见问题解析:兼容性、性能与SDK效果调优
  • 【MCP】其他MCP服务((GitHub)
  • 001大模型-认识大模型以及大模型应用场景
  • docker gaussdb常用命令
  • 从MCU到SoC的开发思维转变
  • 【Python】杂乱-转义字符
  • 安装 NVIDIA 驱动 570.133.20 的自动化脚本
  • 鲁滨逊归结原理详解:期末考点+解题指南
  • 【AI论文】HunyuanCustom:一种多模态驱动的定制视频生成架构
  • 自适应蒙特卡洛定位-AMCL
  • HomeBank:免费且强大的个人财务管理软件
  • 【MySQL】牛客网sql语句简单例题,sql入门
  • 使用Daemonset部署日志收集守护进程
  • snoop操作怎么维护一致性?
  • 射频ADRV9026驱动
  • 供应链学习
  • 电脑端实用软件合集:土拨鼠+Rufus+实时网速监控工具
  • IDEA+git将分支合并到主分支、IDEA合并分支
  • 力扣2094题解
  • langchain4j中使用milvus向量数据库做RAG增加索引
  • 激光雷达点云畸变消除:MCU vs CPU 方案详解