当前位置: 首页 > ai >正文

Ubuntu20.04下GraspNet复现流程中的问题

pytorch+cuda+cudnn的版本问题相对于GraspNet来说至关重要!!!至关重要!!!至关重要!!!(重要的事情说三边)

我的显卡是3070

那么首先说结论
使用30系显卡,低于11.1版本的cuda编译时会出错

nvcc fatal : Unsupported gpu architecture 'compute_86'


之前安装的是 CUDA 11.0,而 compute_86(也就是 RTX 30 系列支持)从 CUDA 11.1 才开始支持,这正是我开始编译失败的原因。

而与之对应的GraspNet官方推荐的pytorch1.6.0,已经在新版本中使用安装命令都会有问题了,下载不下来。

那么现在知道pytorch+cuda+cudnn的版本太低不行,版本高呢?

pytorch版本高于1.9之后编译knn会报错fatal error: THC/THC.h: 没有那个文件或目录
此时我的版本为:

>>> import torch >>> print(torch.__version__) 2.0.0+cu117 >>> print(torch.cuda.is_available()) True >>> print(torch.version.cuda) 11.7


THC/THC.h头文件基本已完全移除,任何试图包含 THC/THC.h 的项目都会编译失败。
甚至于从1.8 之后开始,THC 就已经开始被逐步剥离和隐藏。

这个THC/THC.h 是属于 PyTorch 的 旧版 C/C++ 扩展接口(legacy ATen/TH/THC)


经过一整天对pytorch及cuda/cudnn当前各个版本的尝试之后发现:

安装版本如下可以完美避开版本老旧以及版本过新所造成的各种问题

如nvcc fatal: Unknown option ‘-generate-dependencies-with-compile’问题

point编译和knn编译时出现nvcc fatal  : Unsupported gpu architecture 'compute_86' 问题

THC/THC.h头文件问题等。

>>> import torch
>>> print(torch.__version__)
1.8.0+cu111
>>> print(torch.cuda.is_available())
True
>>> torch.backends.cudnn.version()
8005
>>> print(torch.version.cuda)
11.1
>>> 

实际上对于上述每个问题的解决是有具体办法的,但是有的问题解决起来简单有的却不一定简单,如果可以保留源代码不作修改就能直接使用不失为一种更快捷的办法。
那么下面是安装每个版本的方法:

首先安装cuda和cudnn

cuda版本跟着驱动来我的驱动版本是535

即:

因为是安装特定版本的pytorch、cuda和cudnn我就不说按照官网给的版本匹配来选择了直接就是特定版本的cuda安装

cuda的版本为11.1

在https://developer.nvidia.com/cuda-toolkit-archive

中找到

按照如下步骤选择安装,找到安装命令

具体安装命令如下:

wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.runsudo sh cuda_11.1.1_455.32.00_linux.run

在安装过程中需要取消驱动的安装,这里我安装过了所以用的是别人的图,所以版本可能对不上。到下面的界面后在第一个出按enter取消勾选安装驱动,然后install回车即可开始安装。

随后配置bashrc
在最后面添加

export PATH=$PATH:/usr/local/cuda/bin  
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

之后测试安装是否成功

source ~/.bashrc
nvcc -V

结果如下

安装cudnn

cuDNN Archive | NVIDIA Developer

下载后解压

tar -vxf ./cudnn-linux-x86_64-8.9.7.29_cuda11-archive.tar.xz

复制文件

sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/include/* /usr/local/cuda-11.1/include
sudo cp cudnn-linux-x86_64-8.9.7.29_cuda11-archive/lib/libcudnn* /usr/local/cuda-11.1/lib64

添加权限

sudo chmod a+r /usr/local/cuda-11.1/include/cudnn.h
sudo chmod a+r /usr/local/cuda-11.1/lib64/libcudnn*

测试安装

cat /usr/local/cuda-11.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

结果应该如下

安装pytorch

先安装anaconda,在

Download Now | Anaconda这里下载

下载之后

bash Anaconda3-2023.07-2-Linux-x86_64.sh

根据操作提示一直回车到yes即可

安装完成后激活一个conda环境,我这里给环境名字起得是torch,可以换成其他名字。

conda create -n torch python=3.8

激活对应环境

conda activate torch

退出conda环境

conda deactivate

移除conda环境

conda env remove -n torch

取消默认激活conda环境

conda config --set auto_activate_base false

安装pytorch 1.8.0(虽然是在conda环境中使用的安装命令,但是并不是安装到的conda环境中)

Previous PyTorch Versions | PyTorch

pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html

安装完成后使用命令查看是否安装成功

python
import torch
print(torch.__version__)
print(torch.cuda.is_available())
torch.version.cuda

之后在根据GraspNet官网的步骤一直走下来就可以

GitCode - 全球开发者的开源社区,开源代码托管平台

最后运行sh command_demo.sh即可查看

http://www.xdnf.cn/news/1390.html

相关文章:

  • 26.OpenCV形态学操作
  • tomcat Server 连接服务器 进展
  • LangChain Runnable简介
  • P1613 跑路
  • Eliciting Causal Abilities in Large Language Models for Reasoning Tasks
  • 【Python 学习笔记】 pip指令使用
  • NLP高频面试题(五十二)——BERT 变体详解
  • 什么是数据库的DDL和DML,有什么区别?
  • 《多Agent架构VS千万字长文本VS深度推理引擎——拆解Coze、通义、Kimi的AI终局博弈密码》
  • Go语言学习笔记(一)
  • 数据库11(触发器)
  • 智启未来|艾博连科技加入奇瑞雄狮科技LION AI联合实验室
  • VUE3中使用echarts,配置都正确,不出现tooltip
  • 大厂面试-redis
  • 【KWDB 创作者计划】_深度学习篇---向量指令集
  • system verilog 语句 耗时规则
  • 拥抱基因体检,迎接精准健康管理新时代
  • 3.3 技术框架:LangChain、ReAct、Memory与Tool Integration
  • ROS 快速入门教程02
  • (19)VTK C++开发示例 --- 分隔文本读取器
  • Kafka 详解
  • 服务器上安装jdk
  • Android Cordova 开发 - Cordova 快速入门(Cordova 环境配置、Cordova 第一个应用程序)
  • SQL Server 2022 常见问题解答:从安装到优化的全场景指南
  • Linux部署Web程序
  • openharmony5.0.0中C++公共基础类测试-线程相关(一)
  • 【项目篇】仿照RabbitMQ模拟实现消息队列
  • .NET、java、python语言连接SAP系统的方法
  • 音视频小白系统入门课-4
  • 个人mysql学习笔记