当前位置: 首页 > ops >正文

机器学习与深度学习5:pytorch前馈神经网络FNN实现手写数字识别

一、数据集:

        使用内置MINST函数处理数据。代码会自动下载数据。代码见dataset.py

二、代码部分:

网络结构:

        网络结构为三层神经网络,第一层为输入层,第二层为隐藏层,第三层为输出层,输入层大小为784,隐藏层为256,输出层大小为10。

        前向传播方法:view函数将x展平为一维向量,在实际训练中,输入的x为28*28的灰度图像。通过view函数展平后,得到784个值,将此数据输入第一个线性层,输出256个值再使用ReLu函数激活256个值再更新给x,再通过输出层输出10个值。其中最大的值的索引就为网络预测的值。

训练过程:

训练过程包括5个步骤:计算神经网络结果,计算损失,计算梯度,根据梯度更新参数,清零梯度

dataset.py

import torchvision
from torch.utils.data import DataLoader
from torchvision import transformstransform = transforms.Compose([transforms.ToTensor()  # 转换为张量
])
def getDataloder():train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)print("train_dataset length: ", len(train_dataset))# 小批量的数据读入train_loader = DataLoader(train_dataset, batch_size=512, shuffle=True, num_workers=8)print("train_loader length: ", len(train_loader))return train_loader
def getTestloder():test_dataset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)print("train_dataset length: ", len(test_dataset))# 小批量的数据读入test_loader = DataLoader(test_dataset, batch_size=1, shuffle=True)print("train_loader length: ", len(test_loader))return test_loader
if __name__ == '__main__':getDataloder()

 model.py

import torch
from torch import nn
#from torch import Module
# 定义神经网络Network
class Network(nn.Module):def __init__(self):super().__init__()# 线性层1,输入层和隐藏层之间的线性层self.layer1 = nn.Linear(784, 256)# 线性层2,隐藏层和输出层之间的线性层self.layer2 = nn.Linear(256, 10)# 在前向传播,forward函数中,输入为图像xdef forward(self, x):x = x.view(-1, 28 * 28) # 使用view函数,将x展平x = self.layer1(x)  # 将x输入至layer1#x = torch.sigmoid(x)  # 使用relu激活x = torch.relu(x)return self.layer2(x) # 输入至layer2计算结果

train.py

import torch
from torch import nn
from torch import optim
from model import Network
#from dataset import getDataloder
from dataset_csdn import getDataloder
if __name__ == '__main__':# 小批量的数据读入train_loader = getDataloder()print("train_loader length: ", len(train_loader))device = torch.device("cuda" if torch.cuda.is_available() else "cpu")model = Network().to(device)  # 模型本身,它就是我们设计的神经网络optimizer = optim.Adam(model.parameters())  # 优化模型中的参数#criterion = nn.BCEWithLogitsLoss()criterion = nn.CrossEntropyLoss()  # 分类问题,使用交叉熵损失误差# 进入模型的迭代循环for epoch in range(10):  # 外层循环,代表了整个训练数据集的遍历次数# 整个训练集要循环多少轮,是10次、20次或者100次都是可能的,# 内存循环使用train_loader,进行小批量的数据读取for batch_idx, (data, label) in enumerate(train_loader):data = data.to(device)label = label.to(device)# 内层每循环一次,就会进行一次梯度下降算法# 包括了5个步骤:output = model(data) # 1.计算神经网络的前向传播结果loss = criterion(output, label) # 2.计算output和标签label之间的损失lossloss.backward()  # 3.使用backward计算梯度optimizer.step()  # 4.使用optimizer.step更新参数optimizer.zero_grad()  # 5.将梯度清零# 这5个步骤,是使用pytorch框架训练模型的定式,初学的时候,先记住就可以了# 每迭代100个小批量,就打印一次模型的损失,观察训练的过程if batch_idx % 100 == 0:print(f"Epoch {epoch + 1}/10 "f"| Batch {batch_idx}/{len(train_loader)} "f"| Loss: {loss.item():.4f}")torch.save(model.state_dict(), 'mnist_new.pth') # 保存模型

test.py

import torch
from dataset import getTestloder
from model import Networkif __name__ == '__main__':testDataloader = getTestloder()model = Network()model.load_state_dict(torch.load('./mnist_new.pth'))true_count = 0false_count = 0for idx,(image,label) in enumerate(testDataloader):predict = model(image).argmax(1).item()#print(predict)if predict == label:true_count += 1else:false_count += 1Accuracy = true_count/(true_count+false_count)print(Accuracy)#if(predict == label):

三、项目下载

项目下载地址: 点击下载

http://www.xdnf.cn/news/9067.html

相关文章:

  • Halcon仿射变换---个人笔记
  • PySide6 GUI 学习笔记——常用类及控件使用方法(光标类图标QCursor)
  • 918. 环形子数组的最大和
  • 消费电子卷入“技术军备竞赛”
  • shell脚本基础
  • 记忆上传与自我同一性的哲学-技术综合分析
  • AI日报 - 2025年05月26日
  • 快速了解GO之Channel 通道
  • uv ——新的python包管理工具
  • 如何在 ONLYOFFICE 演示文稿中调整段落首行缩进
  • 第10章 网络与信息安全基础知识
  • 【分治】数组中的逆序对
  • 格恩朗管段超声波流量计:流量测量先锋
  • SD-WAN与传统网络结合:轨道交通网络优化的高效实践与深度解析
  • Day37打卡 @浙大疏锦行
  • 数据库入门:以商品订单系统为例
  • Nuxt.js vs Next.js:Vue 与 React 阵营的 SSR 双雄对比
  • python25-递归算法
  • 人工智能第一币AISPF,首发BitMart交易所
  • P5734 【深基6.例6】文字处理软件
  • Netty学习专栏(六):深度解析Netty核心参数——从参数配置到生产级优化
  • Lines of Thought in Large Language Models
  • (10)-java+ selenium->元素之By class name
  • window 显示驱动开发-Direct3D 呈现性能改进(一)
  • P1068 [NOIP 2009 普及组] 分数线划定
  • 机试 | STL | string | 文字处理软件
  • linux 进程间通信_共享内存
  • Python打卡第37天
  • 数据结构基础知识补充
  • leetcode刷题日记——求根节点到叶节点数字之和