TensorFlow 深度学习 | 使用底层 API 实现模型训练(附可视化与 MLP)
💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖
本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】
TensorFlow 深度学习 | 使用底层 API 实现模型训练(附可视化与 MLP)
在 TensorFlow 中,除了使用 Sequential
或 Functional API
来快速搭建模型外,我们还可以通过 底层 API 手动实现模型训练过程。这种方式适合:
- 理解梯度下降与参数更新机制
- 定制化训练流程(例如 GAN、强化学习等场景)
- 逐步过渡到更复杂的深度学习应用
本文分为两部分:
- 使用底层 API 实现 逻辑回归
- 扩展为 多层感知机(MLP)+ Mini-Batch 训练
📌 一、数据准备
我们生成一个二维数据集用于二分类。
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt# 设置随机种子保证结果可复现
tf.random.set_seed(42)# 生成数据:1000 个样本,每个样本 2 个特征
X = tf.random.normal(shape=(1000, 2))
# 构造标签:线性分隔
y = tf.cast(X[:, 0] + X[:, 1] > 0, tf.float32)
可视化数据分布:
plt.scatter(X[:, 0], X[:, 1], c=y, cmap="bwr", alpha=0.7)
plt.title("数据分布")
plt.xlabel("x1")
plt.ylabel("x2")
plt.show()
📌 二、逻辑回归模型(回顾)
我们先实现一个 逻辑回归模型。
# 参数定义
w = tf.Variable(tf.random.normal([2, 1]))
b = tf.Variable(tf.zeros