当前位置: 首页 > java >正文

【AI训练环境搭建】在Windows11上搭建WSL2+Ubuntu22.04+Tensorflow+GPU机器学习训练环境

一、安装Ubuntu

拿到该文件Ubuntu-22.04.tar


通过wsl导入该虚拟机镜像,然后查看wsl虚拟机列表。

wsl --import Ubuntu-22.04-tensorflow D:\wsl-data\Ubuntu-22.04-tensorflow D:\wsl-data\temp\Ubuntu-22.04.tarwsl -l

进入虚拟机

wsl -d Ubuntu-22.04-tensorflow

二、Ubuntu安装anaconda

1. 复制下载链接

点此链接进入官网,右键复制链接,这是我复制到此链接(https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh)

Download Now | Anaconda

2.通过wget下载anaconda

命令格式:wget [上面复制的xx.sh链接]

wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

下载完成

3.安装anaconda

执行安装命令,按回车健Enter确认安装

sh Anaconda3-2024.10-1-Linux-x86_64.sh

此时,按Page Down翻页快速阅读协议条款

输入yes同意协议条款

继续再按回车健Enter确认安装到/root/anaconda3,如果你想安装到其它目录可以直接输入(不过一般情况下不需要去改)

确认启动时更新和初始化

注意,此时运行conda -V提示没有conda命令,你只需要关闭cmd窗口再进入到unbuntu即可,如果你使用的是windows11,这里也会有快捷进入unbuntu的入口

再次验证conda -V,会输出版本号

至此,anaconda安装成功。

三、安装显卡驱动

注意不需要再再wsl-ubuntu上安装显卡驱动,只需要你的windows上安装好就行,直接运行nvidia-smi即可验证

由于第一次尝试和第二次尝试都失败了,若要快速搭建吗,可直接跳转至第六章节,你只需要注意添加conda清华源就行了。

四、【失败】第一次尝试:创建Conda+TensorFlow+GPU环境

1. 创建新的conda环境

conda环境名称为t1,python版本为3.10

conda create -n t1 python=3.10

2. 进入刚创建conda环境:t1

conda activate t1

3. 安装cudatoolkit和cudnn

安装cudatoolkit的11.2版本和cudnn的8.1版本

conda install cudatoolkit=11.2 cudnn=8.1

设置conda清华源

再来,可以下载了

4.安装tensorflow

 安装tensorflow的2.10.0版本(因为pip源是单独控制的,所以这里临时指定)

pip install tensorflow==2.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

5. 安装tensorflow-gpu的2.10.0版本

pip install tensorflow-gpu==2.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

6 降低numpy的版本到1.22.4

pip install numpy==1.22.4 -i https://pypi.tuna.tsinghua.edu.cn/simple

7. 使用GPU训练

1.克隆cnn-hello
git clone https://gitee.com/fengyefly/cnn-hello
cd cnn-hello/

2.运行cnn-hello-train.py
python cnn-hello-train.py

发现未调用GPU!由于以上是再windows跑通的,再ubuntu下没必要按这个版本,下面尝试重新创建一个conda环境,然后用比较新的版本。(原因也可以看看下面这个官方说明)

退出conda t1环境

conda deactivate

五、【失败】第二次尝试:创建Conda+TensorFlow+GPU环境(python 12)

 1. 创建新的conda环境

conda环境名称为t2,这次我们使用python版本为3.12

conda create -n t2 python=3.12

2. 进入刚创建conda环境:t2

conda activate t2

3. 安装cudatoolkit和cudnn

conda install cudatoolkit=12.5
conda install cudnn=9.3

4.安装tensorflow

pip install tensorflow==2.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

5. 尝试使用GPU训练

六、【成功】第三次尝试:创建Conda+TensorFlow+GPU环境(python 12)

参阅了官网的教程,改进安装方案。

1.创建新的conda环境

conda create -n t4 python=3.12

2.安装tensorflow[and-cuda]

注意:此处的命令不仅仅是tensorflow,而多了一个[and-cuda],意味着它会帮我们把cudatoolkit和cudnn自动装好。

pip install tensorflow[and-cuda]

 3.验证GPU

执行该命令,可以看到成功加载到GPU。

python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"

 七. 使用GPU训练速度体验

1.克隆cnn-hello

git clone https://gitee.com/fengyefly/cnn-hello
cd cnn-hello/

2.运行cnn-hello-train.py

python cnn-hello-train.py

 经验证,训练用时约13s,和我在windows上直接用conda安装的环境下,用时非常接近!

至此,已经完成在Windows11上搭建WSL2+Ubuntu22.04+Tensorflow+GPU机器学习训练环境。感谢阅读!真材实料的实践分享,别忘记给个点赞哦👍。

http://www.xdnf.cn/news/653.html

相关文章:

  • 996引擎-拓展变量:物品变量
  • 【技术派后端篇】Redis实现统计计数
  • 全同态加密医疗数据分析集python实现
  • 深入探索 Unix 与 Linux:历史、内核及发行版
  • QML 样式库
  • OpenCV基础01-图像文件的读取与保存
  • 【每日八股】复习计算机网络 Day3:TCP 协议的其他相关问题
  • Qt基础005(文件操作后续)
  • 中间件--ClickHouse-14--案例-3-其他案例思路概述
  • 爆肝整理!Stable Diffusion的完全使用手册(二)
  • trivy开源安全漏洞扫描器——筑梦之路
  • 【21天学习打卡挑战赛】如何学习WEB安全:逼自己在短时间掌握WEB安全核心内容
  • 深入理解 CICD 与 Jenkins 流水线:从原理到实践
  • Python 项目环境配置与 Vanna 安装避坑指南 (PyCharm + venv)
  • 机器学习中的“三态模型“:过拟合、欠拟合和刚刚好
  • WordPress按分类ID调用该分类的内容数量
  • 【网络】数据链路层知识梳理
  • Vue3项目自定义全局防抖节流
  • Linux命令-Shell编程
  • 星拍相机APP:时尚与科技的完美融合,打造你的专属美
  • 【Docker项目实战】使用Docker部署Jupyter Notebook服务
  • go语言对http协议的支持
  • 对象多态与行为多态
  • 网络开发基础(游戏)之 二进制数据处理
  • SSM(SpringMVC+spring+mybatis)整合的步骤以及相关依赖
  • JVM垃圾回收器整理
  • Oracle EBS COGS Recognition重复生成(一借一贷)
  • Docker Registry(镜像仓库)
  • Linux网络编程 TCP---并发服务器:多进程架构与端口复用技术实战指南
  • OpenCV 高斯模糊 cv2.GaussianBlur