当前位置：首页 > backend >正文

# 深度学习实操附录B 深入解析 tensorflow 自动微分

backend 2025/7/2 14:52:21

深度学习实操附录B 深入解析 tensorflow 自动微分

内容概要

附录B详细介绍了TensorFlow的自动微分（autodiff）功能，以及与其他微分方法的比较。自动微分是机器学习中计算梯度的关键技术，尤其在训练神经网络时至关重要。章节涵盖了手动微分、有限差分近似、前向模式自动微分和反向模式自动微分等方法，并重点解释了TensorFlow如何实现反向模式自动微分。
在这里插入图片描述

主要内容

手动微分
- 使用微积分知识手动推导函数的导数，适用于简单函数，但对复杂函数非常繁琐且容易出错。
有限差分近似
- 通过计算函数在某一点附近的小变化来估计导数，简单但精度低，适用于验证其他方法的正确性。
前向模式自动微分
- 从输入到输出遍历计算图，使用对偶数（dual numbers）来同时计算函数值和导数，适合输入变量较少的情况。
反向模式自动微分
- TensorFlow采用的反向模式自动微分，通过两次遍历计算图（正向和反向）来高效计算所有偏导数，特别适合神经网络训练。

精彩语录

中文：反向模式自动微分在处理多输入少输出的函数时非常高效，只需两次遍历计算图即可计算所有偏导数。
英文原文：Reverse-mode autodiff shines when there are many inputs and few outputs: it can compute all partial derivatives in just two passes through the graph.
解释：强调了反向模式自动微分在神经网络训练中的高效性，适合处理大量参数和单个损失函数的场景。
中文：手动微分虽然精确，但对于复杂函数非常繁琐且容易出错。
英文原文：Manual differentiation can become very tedious for more complex functions, and you run the risk of making mistakes.
解释：指出了手动微分的局限性，尤其是在处理复杂函数时。
中文：有限差分近似虽然简单，但精度低且计算效率低，不适合大规模神经网络训练。
英文原文：Finite difference approximation is simple to implement but can be very imprecise and inefficient for large neural networks.
解释：说明了有限差分近似在实际应用中的局限性，尤其是在处理大规模模型时。

关键代码

使用TensorFlow进行自动微分

import tensorflow as tf# 定义函数 f(x, y) = x^2 * y + y + 2
x = tf.Variable(3.0)
y = tf.Variable(4.0)with tf.GradientTape() as tape:f = x**2 * y + y + 2# 计算梯度
df_dx, df_dy = tape.gradient(f, [x, y])print(f"df/dx: {df_dx.numpy()}")  # 输出: 24.0
print(f"df/dy: {df_dy.numpy()}")  # 输出: 10.0

使用计算图和反向模式自动微分

import tensorflow as tf# 定义计算图
x = tf.constant(3.0)
y = tf.constant(4.0)
with tf.GradientTape() as tape:tape.watch(x)tape.watch(y)f = x**2 * y + y + 2# 计算梯度
df_dx, df_dy = tape.gradient(f, [x, y])print(f"df/dx: {df_dx.numpy()}")  # 输出: 24.0
print(f"df/dy: {df_dy.numpy()}")  # 输出: 10.0