当前位置：首页 > ops >正文

使用PyTorch构建全连接神经网络实现MNIST手写数字分类

ops 2025/9/6 5:43:41

在深度学习领域，图像分类是最基础也是最经典的任务之一。MNIST手写数字数据集作为计算机视觉领域的"Hello World"，包含了60,000个训练样本和10,000个测试样本，每个样本都是28×28像素的灰度图像，对应0-9十个数字类别。本文将详细介绍如何使用PyTorch框架构建全连接神经网络(FCN)来完成MNIST手写数字分类任务。

一、全连接神经网络基础

1.1 什么是全连接神经网络

全连接神经网络(Fully Connected Neural Network)，也称为多层感知机(Multi-Layer Perceptron, MLP)，是最基础的深度学习模型之一。在这种网络中，每一层的每个神经元都与下一层的所有神经元相连接，因此称为"全连接"。

1.2 全连接网络的结构

一个典型的三层全连接网络包括：

输入层：接收原始数据
隐藏层：进行特征提取和转换
输出层：产生最终预测结果

对于MNIST分类任务，输入层需要处理28×28=784个像素值，输出层需要产生10个类别的概率分布。

1.3 全连接网络的优缺点

优点：

结构简单，易于理解和实现
对数据预处理要求相对较低
在小规模数据集上表现良好

缺点：

参数量大，容易过拟合
忽略了图像的空间局部性
对于大规模图像数据表现不如卷积神经网络

二、PyTorch框架简介

PyTorch是由Facebook开发的开源深度学习框架，以其动态计算图和简洁的API设计受到研究人员和开发者的广泛欢迎。PyTorch的核心组件包括：

torch.Tensor：支持自动微分的多维数组
torch.nn：神经网络层和损失函数的集合
torch.optim：各种优化算法的实现
torch.utils.data：数据加载和预处理的工具

三、项目实现详解

3.1 环境准备

首先需要安装必要的Python库：

pip install torch torchvision matplotlib

3.2 数据加载与预处理

MNIST数据集可以通过torchvision方便地获取：

from torchvision import datasets, transforms# 定义数据转换
transform = transforms.Compose([transforms.ToTensor(),  # 转换为Tensortransforms.Normalize((0.1307,), (0.3081,))  # 标准化
])# 加载数据集
train_dataset = datasets.MNIST('./data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST('./data', train=False, download=True, transform=transform)

数据标准化使用MNIST数据集的全局均值(0.1307)和标准差(0.3081)，这有助于模型更快收敛。

3.3 构建全连接网络

我们实现一个三层的全连接网络：

import torch.nn as nn
import torch.nn.functional as Fclass FCNet(nn.Module):def __init__(self):super(FCNet, self).__init__()self.fc1 = nn.Linear(28*28, 512)  # 输入层到隐藏层1self.fc2 = nn.Linear(512, 256)    # 隐藏层1到隐藏层2self.fc3 = nn.Linear(256, 10)     # 隐藏层2到输出层self.dropout = nn.Dropout(0.2)    # Dropout层def forward(self, x):x = x.view(-1, 28*28)            # 展平输入x = F.relu(self.fc1(x))x = self.dropout(x)x = F.relu(self.fc2(x))x = self.dropout(x)x = self.fc3(x)                  # 输出层不使用激活函数return x

网络结构说明：

输入层：784个神经元(对应28×28图像)
第一个隐藏层：512个神经元，使用ReLU激活
第二个隐藏层：256个神经元，使用ReLU激活
输出层：10个神经元(对应10个数字类别)
在两个隐藏层后添加Dropout层，丢弃概率为20%，防止过拟合

3.4 训练过程实现

训练过程包括前向传播、损失计算、反向传播和参数更新：

def train(model, device, train_loader, optimizer, epoch):model.train()for batch_idx, (data, target) in enumerate(train_loader):data, target = data.to(device), target.to(device)optimizer.zero_grad()  # 梯度清零output = model(data)  # 前向传播loss = F.cross_entropy(output, target)  # 计算损失loss.backward()        # 反向传播optimizer.step()       # 参数更新# 打印训练进度if batch_idx % 100 == 0:print(f'Epoch: {epoch} [{batch_idx*len(data)}/{len(train_loader.dataset)} 'f'({100.*batch_idx/len(train_loader):.0f}%)]\tLoss: {loss.item():.6f}')

3.5 测试过程实现

测试阶段不计算梯度，只评估模型性能：

def test(model, device, test_loader):model.eval()test_loss = 0correct = 0with torch.no_grad():  # 不计算梯度for data, target in test_loader:data, target = data.to(device), target.to(device)output = model(data)test_loss += F.cross_entropy(output, target, reduction='sum').item()pred = output.argmax(dim=1, keepdim=True)  # 获取预测结果correct += pred.eq(target.view_as(pred)).sum().item()test_loss /= len(test_loader.dataset)print(f'Test set: Average loss: {test_loss:.4f}, 'f'Accuracy: {correct}/{len(test_loader.dataset)} 'f'({100.*correct/len(test_loader.dataset):.1f}%)')

3.6 主训练循环

def main():# 设置设备device = torch.device("cuda" if torch.cuda.is_available() else "cpu")# 初始化模型model = FCNet().to(device)# 定义优化器optimizer = optim.Adam(model.parameters(), lr=0.001)# 创建数据加载器train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)test_loader = DataLoader(test_dataset, batch_size=1000, shuffle=False)# 训练和测试epochs = 10for epoch in range(1, epochs + 1):train(model, device, train_loader, optimizer, epoch)test(model, device, test_loader)# 保存模型torch.save(model.state_dict(), "mnist_fc.pth")