史上最强 PyTorch 2.2 GPU 版最新安装教程

一 深度学习主机

1.1 配置

先附上电脑配置图,如下:

利用公司的办公电脑对配置进行升级改造完成。除了显卡和电源,其他硬件都是公司电脑原装。

1.2 显卡

有钱直接上 RTX4090,也不能复用公司的电脑,其他配置跟不上。
进行深度学习,除了看算力外,还需要看显存大小,最用在 RTX3060 12G显存和RTX 4060 16G显存 之间进行了选择。 最后买了RTX 4060 16G显存的显卡。
显卡大小:显卡有1风扇、2风扇和3风扇之分,风扇越多散热性能越好,但是我的电脑是itx 小机箱,最后买了个2风扇的显卡。

1.3 电源

原电源为310w, 更换成了650w的电源。 买显卡时,都会写建议电源功率。

1.4 风扇

担心散热问题,换了个好点的风扇。后来发现还不如不换,太能折腾了。

至此,深度学习入门主机硬件准备完毕。哈哈。

二 安装显卡驱动

官方客服给的启动安装方法:

您好,这个是N卡官网的驱动下载链接:https://www.nvidia.cn/Download/Find.aspx?lang=cn
您选择好您的显卡版本,选择对应的系统版本后点击搜索就可以了
主要玩游戏选择geforce game ready,主要用来做设计选择studio驱动。
如何选择对应的显卡版本:
★★★★★★★★★
这部分您要仔细看下的哦~
★★★★★★★★★
产品类型:
选择Geforce
产品系列:
例如4060 4070 4080 4090就选择Geforce RTX 40 series
3050 3060 3070 3080 3090就选择Geforce RTX 30 series 
2060 2070 2080 就选择Geforce RTX 20 series
1650 1660就选择 Geforce 16 series
1030 1050 1060 1070 1080就选择 Geforce 10 series
960 970 980就选择 Geforce 900 series
710 730就选择 Geforce 700 series
★★★★重点注意!(不要选择后缀带notebooks的那个是笔记本的驱动)★★★★
产品家族:
在这里选择您具体的显卡型号就可以了哈~
具体的显卡型号您可以通过您的商品订单,或者是显卡包装盒上看到的哈~
操作系统:
选择您当前电脑的系统即可
其他的选项默认即可
会出来很多驱动版本的选项,任意选择一个对应类型的下载安装就可以的 

深度学习选择studio驱动


可以同时安装两种驱动,自由切换。

不安装此显卡驱动,hdmi连接显卡后,我的显示屏显示有问题

三 安装python

Latest PyTorch requires Python 3.8 or later.

从 https://www.anaconda.com/download 下载对应的 Anaconda 版本安装即可。
打开 Anaconda 创建虚拟环境 torch2_gpu, 如下图所示:

打开终端验证:

四 安装 Visual Studio

安装 CUDA 之前需要先安装 Visual Studio, 否则会出现如下提示:

从 https://visualstudio.microsoft.com/zh-hans/free-developer-offers/ 下载 Visual Studio Community.
在安装选项,选择 使用C++的桌面开发 即可。

五 CUDA 安装

5.1 CUDA 简介

官网地址:https://developer.nvidia.com/cuda-toolkit
CUDA(Compute Unified Device Architecture)是由NVIDIA开发的并行计算平台和编程模型,用于利用NVIDIA GPU(Graphics Processing Unit)进行通用目的计算(GPGPU)。它是一种为GPU编程提供高性能和易用性的软件环境。
CUDA的主要目标是将GPU作为计算加速设备,用于执行并行计算任务,特别是科学计算和深度学习等领域。它通过提供一套编程接口(API)和工具集,使开发者能够利用GPU的大规模并行计算能力,以加速计算密集型任务。
使用CUDA,开发者可以使用编程语言如C/C++、Python等来编写GPU加速的程序。CUDA提供了一系列库和工具,如CUDA Runtime库、CUDA Tools(如nvcc编译器)和NVIDIA Nsight开发环境,用于编译、调试和优化CUDA程序。
CUDA的优势在于其紧密结合了NVIDIA GPU的体系结构特点,可对任务进行细粒度的并行处理,并利用GPU上的数百到数千个核心同时执行计算任务。这使得CUDA成为目前广泛应用于科学计算、数值模拟、深度学习等领域的GPU编程平台。
值得注意的是,对于使用CUDA进行开发的程序,其执行的硬件需求需要是支持CUDA的NVIDIA GPU,并且需要安装相应的CUDA驱动程序和运行时库。

5.2 查看 CUDA 版本

  1. 命令行查看 CUDA 版本

  1. NAVIDIA 控制面板中查看 CUDA 版本

打开 NVIDIA Control Panel

点击 管理 3D 设置 --> 系统信息

查看 CUDA 版本为:12.4

上述结果说明可以安装 CUDA 12.4 及以下的版本。
不要着急直接安装该版本的 CUDA,因为还有需要安装配套的pytorch。

5.3 确定 CUDA 和 PyTorch 版本

从 PyTorch 官网 https://pytorch.org 确定对应关系,如下图所示:

我们选择安装最新版 PyTorch 2.2.2 以及对应的计算平台 CUDA 12.1

5.4 CUDA 下载安装

  1. 进入 CUDA 官网,根据上面确定的 CUDA 版本,下载对应的版本。

  1. 点击下载的 exe 文件进行安装

  1. 选择安装目录

  1. 系统检查完毕,点击同意

  1. 选择 自定义安装,点击下一步

  1. 继续点击下一步

  1. 选择安装路径,一般默认即可。

  1. 等待安装完成

  1. 点击下一步

  1. 点击关闭,结束

  1. 查看环境变量,已经自动配置

5.5 验证 CUDA 是否安装成功

六 cuDNN 安装

6.1 cuDNN 简介

官网地址:https://developer.nvidia.com/cudnn

cuDNN(CUDA Deep Neural Network)是由NVIDIA开发的深度神经网络(DNN)加速库,专门用于在CUDA平台上进行深度学习任务的加速。
cuDNN提供了高度优化的DNN(深度神经网络)基础操作和算法实现,如卷积、池化、归一化、激活函数等,以及自动求导和张量操作等。它利用了NVIDIA GPU的并行计算能力和高度可编程的架构,提供了高性能的DNN计算和训练加速。
通过使用cuDNN,深度学习框架(如TensorFlow、PyTorch等)可以利用其提供的GPU加速功能,加快训练和推理的速度。cuDNN库实现了高效的卷积计算和其他操作,优化了计算过程和内存使用,以最大化GPU的利用率和性能。
cuDNN还提供了一些高级功能,如自动调整算法的性能和内存使用、混合精度计算等,以进一步提高深度学习任务的效率和性能。
一句话说明,cuDNN是NVIDIA为深度学习开发者提供的一个重要工具,它通过高度优化的DNN操作和算法实现,使得深度学习框架能够更有效地利用CUDA和NVIDIA GPU的性能,加速深度学习任务的执行。
它的主要特性如下:

  • 为各种常用卷积实现了 Tensor Core 加速,包括 2D 卷积、3D 卷积、分组卷积、深度可分离卷积以及包含 NHWC 和 NCHW 输入及输出的扩张卷积
  • 为诸多计算机视觉和语音模型优化了内核,包括 ResNet、ResNext、EfficientNet、EfficientDet、SSD、MaskRCNN、Unet、VNet、BERT、GPT-2、Tacotron2 和 WaveGlow
  • 支持 FP32、FP16、BF16 和 TF32 浮点格式以及 INT8 和 UINT8 整数格式
  • 4D 张量的任意维排序、跨步和子区域意味着可轻松集成到任意神经网络实现中
  • 能为各种 CNN 体系架构上的融合运算提速

注意:在数据中心和移动 GPU 中采用 Ampere、Turing、Volta、Pascal、Maxwell 和 Kepler GPU 体系架构的 Windows 和 Linux 系统均支持 cuDNN。

6.2 cuDNN 下载安装

  1. 进入 cuDNN 官网,选择对应的版本进行下载。


因此时没有win11的选项,故选择 Tarball 进行下载。

  1. 将下载的压缩包解压

  1. 将解压后 bin 目录的内容全部放到 CUDA 对应的 bin 目录下。

  1. 将解压后 include 目录的内容全部放到 CUDA 对应的 include 目录下

  1. 将解压后 lib 目录下 x86 目录内容全部放到 CUDA 对应的 lib 目录下 x86 目录下

  1. 配置环境变量,将 CUDA bin/include/lib下x86目录配置到环境变量中。


只需添加绿框中两个环境变量即可,因为前两个在用 exe 文件安装 cuda 时已经自动添加了。

6.3 验证 cuDNN 是否安装成功

返回 GPU 型号,则安装成功。

七 PyTorch 安装

7.1 安装

根据官网安装信息

使用如下命令进行安装:

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia


如果使用 pip 进行安装,命令如下:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

查看安装包,如下图所示:

7.2 验证 GPU 是否可用

torch.cuda.is_available() 为True则GPU可用,False表示不可用。

import torch
print(torch.__version__)
print(torch.version.cuda)
# 输出为True,则安装无误
print(torch.cuda.is_available())  

结果如下图所示:

八 参考链接

  • https://blog.csdn.net/m0_63007797/article/details/132269612
  • https://zhuanlan.zhihu.com/p/651151335

欢迎关注微信公众号:大数据AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1319968.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

CMS(并发)垃圾处理器

CMS垃圾处理器 A初始标记,BCD并发标记,重新标记是指在并发标记阶段,有业务线程存在所以可能有一些对象会重新被引用,所以得重新标记。 在初始标记重新标记阶段会STW 并发标记阶段会产生漏标和多标的问题。 优点:并发…

Golang 内存管理和垃圾回收底层原理(一)

一、这篇文章我们来聊聊Golang内存管理和垃圾回收,主要注重基本底层原理讲解,进一步实战待后续文章 1、这篇我们来讨论一下Golang的内存管理 先上结构图 从图我们来讲Golang的基本内存结构,内存结构可以分为:协程缓存、中央缓存…

php phar反序列化POC编写笔记

具体结构不细究,主要方便写poc代码,比如有如下文件内容: 文件内容如下: file base64.b64decode("PD9waHAgX19IQUxUX0NPTVBJTEVSKCk7ID8DQp9AQAAAQAAABEAAAABAAAAAABHAQAATzo0MDoiSWxsdW1pbmF0ZVxCcm9hZGNhc3RpbmdcUGVuZG…

宝塔面板提示当前未安装docker或docker-compose有效解决方案!

宝塔面板提示当前未安装docker或docker-compose有效解决方案! 首先点面板的安装docker后依旧提示【当前未安装docker或docker-compose,点击安装】,解决方法就是输入两条命令后刷新即可,命令ln -s /usr/local/bin/docker-compose /usr/bin/doc…

Flask Python:如何获取不同请求方式的参数

Flask中 如何获取不同请求方式的参数 前言一、get请求下1.1、路径中带有参数1.1.1、postman示例1.1.2、 flask代码实现1.1.3、 注意事项 1.2、在url后边带有参数1.2.1、postman示例1.2.2、 flask代码实现 二、post请求下2.1、form-data格式2.1.1、postman示例2.1.2、flask代码实…

蓝桥杯-dfs搜索模板题(一)

蓝桥杯-dfs搜索模板题&#xff08;一&#xff09; P2089 烤鸡P1088 火星人P1149 火柴棒等式P2036 PERKETP1135 奇怪的电梯结语 P2089 烤鸡 对于每个位置枚举数字 #include<bits/stdc.h>using namespace std;const int N1010;int n;int arr[N];//临时方案 int res0;//方案…

AI音乐GPT时刻来临:Suno 快速入门手册!

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

搜索二维矩阵 II - LeetCode 热题 21

大家好&#xff01;我是曾续缘&#x1f497; 今天是《LeetCode 热题 100》系列 发车第 21 天 矩阵第 4 题 ❤️点赞 &#x1f44d; 收藏 ⭐再看&#xff0c;养成习惯 搜索二维矩阵 II 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性&…

软件架构风格_2.调用/返回体系结构风格

调用/返回风格是指在系统中采用了调用与返回机制。利用调用-返回实际上是一种分而治之的策略&#xff0c;其主要思想是将一个复杂的大系统分解为若干子系统&#xff0c;以便降低复杂度&#xff0c;并且增加可修改性。程序从其执行起点开始执行该构件的代码&#xff0c;程序执行…

Groovy 介绍、下载、语法

Groovy 简介 Groovy 可以被视为Java 的一种脚本化改良版&#xff0c;Groovy 也是运行在 JVM 上&#xff0c;可以很好地与 Java 代码及其相关库进行交互操作。Groovy 是一种成熟的面向对象编程语言&#xff0c;既可以面向对象编程&#xff0c;又可以用作纯粹的脚本语言。大多数…

融资融券有什么优点和缺点?融资利率和费率多少?

融资融券是一种证券信用交易&#xff0c;指投资者向具有融资融券业务资格的证券公司提供担保物&#xff0c;借入资金买入证券或者借入证券并卖出的行为 融资融券的优点有&#xff1a; 增加交易资金。投资者可以通过融资融券账户&#xff0c;向证券公司借入资金&#xff0c;增加…

sa-token非Web上下文无法获取Request

0x02 非Web上下文无法获取Request 问题定位 在我们使用sa-token安全框架的时候&#xff0c;有时候会提示&#xff1a;**SaTokenException:非Web上下文无法获取Request**** 错误截图&#xff1a; 在官方网站中&#xff0c;查看常见问题排查&#xff1a; 非Web上下文无法获取…

QT使用数据库和proC数据库

一&#xff0c;QT使用数据库 数据库就是保存数据的文件。可以存储大量数据&#xff0c;包括插入数据、更新数据、截取数据等。用专业术语来说&#xff0c;数据库是“按照数据结构来组织、存储和管理数据的仓库”。 什么时候需要数据库&#xff1f;在嵌入式里&#xff0…

每日一题(leetcode169):多数元素-哈希、随机、分治

哈希&#xff1a; class Solution { public:int majorityElement(vector<int>& nums) {int lennums.size();unordered_map<int,int> map;for (int i0;i<len;i){if(map.find(nums[i])map.end()){map[nums[i]]1;}else{map[nums[i]];}}int seqlen/2;int ansnu…

FebHost:注册人工智能.AI域名的优势?

近年来,人工智能技术的飞速发展,让AI在各行各业扮演着愈发重要的角色。在这一背景下,.AI域名凭借其独特的优势,正成为越来越多AI从业者的首选。那么,.AI域名到底有哪些亮点,值得广大AI企业和个人关注呢?记者进行了深入探访。 专业形象加分 彰显技术实力 要说.AI域名的最大优势…

yolov5关键点检测-实现溺水检测与警报提示(代码+原理)

基于YOLOv5的关键点检测应用于溺水检测与警报提示是一种结合深度学习与计算机视觉技术的安全监控解决方案。该项目通常会利用YOLOv5强大的实时目标检测能力&#xff0c;并通过扩展或修改网络结构以支持人体关键点检测&#xff0c;来识别游泳池或其他水域中人们的行为姿态。 项…

为何网易游戏会选择引入OceanBase数据库

本文作者&#xff1a;田维繁&#xff0c;网易游戏关系型数据库小组负责人 作为中国游戏开发领域的佼佼者&#xff0c;网易游戏始终站在网络游戏自主研发的前沿。其产品及周边产品线丰富多样&#xff0c;因此&#xff0c;为满足各种业务场景的需求&#xff0c;需要多种不同的数据…

delphi获取windows右下角任务栏图标信息

今天在群里,看有人问怎么获取windows右下角任务栏图标信息 win7 x64 测试通过 unit Unit1;interfaceusesWinapi.Windows, Winapi.Messages, System.SysUtils, System.Variants, System.Classes, Vcl.Graphics,Vcl.Controls, Vcl.Forms, Vcl.Dialogs,commctrl, Vcl.StdCtr…

烂笔头笔记:Windows 11下照片查看器显示偏色问题修复

本文出处&#xff1a;http://blog.csdn.net/chaijunkun/article/details/137278931&#xff0c;转载请注明。由于本人不定期会整理相关博文&#xff0c;会对相应内容作出完善。因此强烈建议在原始出处查看此文。 最近在研究HDR视频的截图算法&#xff0c;目的就是生成色彩正确…

并发编程01-深入理解Java并发/线程等待/通知机制

为什么我们要学习并发编程&#xff1f; 最直白的原因&#xff0c;因为面试需要&#xff0c;我们来看看美团和阿里对 Java 岗位的 JD&#xff1a; 从上面两大互联网公司的招聘需求可以看到&#xff0c; 大厂的 Java 岗的并发编程能力属于标配。 而在非大厂的公司&#xff0c; 并…