当前位置: 首页 > ai >正文

1. 前言与安装pytorch、d2l

书本电子版:https://zh.d2l.ai/index.html

前言

  • 神经网络是深度学习前身

  • 全书结构:
    在这里插入图片描述

    • 第一部分包括基础知识和预备知识。 1节提供深度学习的入门课程。然后在 2节中,我们将快速介绍实践深度学习所需的前提条件,例如如何存储和处理数据,以及如何应用基于线性代数、微积分和概率基本概念的各种数值运算。
      3节 和 4节涵盖了深度学习的最基本概念和技术,例如线性回归、多层感知机和正则化。
    • 接下来的五章集中讨论现代深度学习技术。 5节描述了深度学习计算的各种关键组件,并为我们随后实现更复杂的模型奠定了基础。接下来,在6节 和 7节中,我们介绍了卷积神经网络(convolutional neural network,CNN),这是构成大多数现代计算机视觉系统骨干的强大工具。随后,在8节 和 9节中,我们引入了循环神经网络(recurrent neural network,RNN),这是一种利用数据中的时间或序列结构的模型,通常用于自然语言处理和时间序列预测。在10节中,我们介绍了一类新的模型,它采用了一种称为注意力机制的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将帮助读者快速了解大多数现代深度学习应用背后的基本工具。
    • 第三部分讨论可伸缩性、效率和应用程序。 首先,在11节中,我们讨论了用于训练深度学习模型的几种常用优化算法。下一章12节将探讨影响深度学习代码计算性能的几个关键因素。在 13节中,我们展示了深度学习在计算机视觉中的主要应用。在14节 和 15节中,我们展示了如何预训练语言表示模型并将其应用于自然语言处理任务。

安装

1.安装pytorch-gpu

建議不要使用书本的torch版本,版本太老会报错,直接用最新的就好

# cpu
pip install torch==1.12.0
pip install torchvision==0.13.0#gpu
conda create -n torch270 python=3.10
conda activate torch270pip uninstall torch torchvision torchaudio -y
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

conda create -n torch112 python=3.10
conda activate torch112
pip install torch1.12.0+cu116 torchvision0.13.0+cu116 -f https://download.pytorch.org/whl/torch_stable.html

1.1python对应版本要求

PyTorch 版本CUDA 版本对应 Python 支持范围❌ 不支持的版本
torch==1.12.0+cu116CUDA 11.6Python 3.7 ~ 3.10Python 3.6 及以下:太旧,不支持。Python 3.11 / 3.12:太新,PyTorch 1.12.0 还不支持。
torchvision==0.13.0+cu116与上兼容✅ 同样支持 Python 3.7 ~ 3.10同上

1.2如何查看自己当前的 Python 版本?

python --version

2.安装d2l

安装d2l包,以方便调取本书中经常使用的函数和类:
使用1.0.0-alpha0版本
如果使用书本的 0.17.6 版本会报错,因为这是 基于 MXNet 或 PyTorch 教材代码的旧版本。它自动依赖一些较老的库,例如 pandasmatplotlib 等,没有明确固定版本,pip 默认会尝试拉最新的源码版本(.tar.gz)。
在 Windows 上没有对应版本的 .whl,于是 pip 尝试 从源码编译 pandas → 就失败了(因为 Visual Studio 编译器环境复杂、缺失 ssize_t)。

pip install d2l==1.0.0-alpha0

3.下载 D2L Notebook

```
mkdir d2l-zh && cd d2l-zh
curl https://zh-v2.d2l.ai/d2l-zh-2.0.0.zip -o d2l-zh.zip
unzip d2l-zh.zip && rm d2l-zh.zip
cd pytorch
```

注意:如果没有安装unzip,则可以通过运行sudo apt install unzip进行安装。
安装完成后我们可以通过运行以下命令打开Jupyter笔记本(在Window系统的命令行窗口中运行以下命令前,需先将当前路径定位到刚下载的本书代码解压后的目录):

`jupyter notebook`

符号

https://zh.d2l.ai/chapter_notation/index.html

http://www.xdnf.cn/news/10654.html

相关文章:

  • 【Java学习笔记】异常
  • Chapter 10 Inductive DC–DC Converters
  • MCP (模型上下文协议):AI界的“USB-C”标准,开启大模型应用新纪元
  • C语言基础(10)【二维数组 字符数组 字符串相关操作】
  • 代码随想录算法训练营第十一天 | 150. 逆波兰表达式求值、239. 滑动窗口最大值、347.前 K 个高频元素、栈与队列总结
  • 光伏功率预测 | LSTM多变量单步光伏功率预测(Matlab完整源码和数据)
  • 用“照片放大/缩小”来通俗理解多尺度
  • QT入门学习(二)---继承关系、访问控制和变量定义
  • Dockerfile常用指令介绍
  • 【Redis】Set 集合
  • Python列表、字典、元组、集合
  • 推荐一款使用html开发桌面应用的工具——mixone
  • 39. 组合总和【 力扣(LeetCode) 】
  • 从万物互联到万体智联:论智能体互联网带来的产业革命
  • 可视化大屏如何制作
  • SQL快速入门【转自牛客网】
  • 强人工智能 vs 弱人工智能:本质区别与未来展望
  • CppCon 2014 学习:Defensive Programming Done Right.
  • 嵌入式Linux 期末复习指南(下)
  • Java递归编程中的StackOverflowError问题分析与解决方案
  • 软件测评师教程 第9章 基于质量特性的测试与评价 笔记
  • 新版智慧社区(小区)智能化弱电系统解决方案
  • 记录一次由打扑克牌测试国内各家大模型的经历
  • 序列搜索策略
  • 探秘 Minimax:AI 领域的创新先锋
  • CangjieMagic 智能体框架嵌入式系统实测:以树莓派 4B 为例
  • 【Redis技术进阶之路】「系统架构系列中篇」高可用之Master-Slave主从架构的复制问题(分析旧版点制功能)
  • rabbitmq Direct交换机简介
  • K-匿名模型
  • 强类型语言和弱类型语言