当前位置: 首页 > backend >正文

深度学习-模型训练的相关概念

Epoch

        1个Epoch表示模型完整遍历一次整个训练数据集的过程,例如,训练10个Epoch表示模型将这个数据集反复学习10次;

        模型需要多次遍历数据集(多个Epoch)才会学习数据中的模式,单词遍历数据集(1个Epoch)通常不足以让模型收敛,多次遍历可以逐步优化模型参数。

Batch Size

        Batch Size是每次训练时输入的样本数量。例如,Batch Size=32 表示每次用32个样本计算一次梯度并更新模型参数

        小批量数据计算梯度比单样本(Batch Size=1)更稳定,比全批量(Batch Size=全体数据)更高效。并且较小的Batch Size可能带来更多噪声,有助于模型泛化。

Iteration

        一次Iteration表示完成一个Batch数据的正向传播(预测)和反向传播(更新参数)的过程。

        例如,数据集现有2000个样本,对其训练10个Epoch,选择Batch Size=64:

        Batch个数为2000//64+1=31+1=32个(最后一个Batch仅有16个样本)。

        每个Epoch中迭代次数Itreation=32次。

        总迭代次数为10×32=320次。

        总训练样本数为10×2000=20000。

http://www.xdnf.cn/news/9721.html

相关文章:

  • 【spring】spring中的retry重试机制; resilience4j熔断限流教程;springboot整合retry+resilience4j教程
  • java中自定义注解
  • WildDoc:拍照场景下的文档理解——数据真香
  • ETL怎么实现多流自定义合并?
  • 信奥之计算原理与排列组合
  • 人工智能在智慧物流中的创新应用与未来趋势
  • mybatis plus的源码无法在idea里 “download source“
  • 勾股数的性质和应用
  • JS逆向 【QQ音乐】sign签名| data参数加密 | AES-GCM加密 | webpack实战 (上)
  • Dify案例实战之智能体应用构建(一)
  • wewin打印机 vue版本 直接用
  • ABF膜介绍
  • 免杀二 内存函数与加密
  • QTest应用迷城
  • 鸿蒙完整项目-仿盒马App(一)首页静态页面
  • 极坐标下 微小扇环 面积微元
  • 数据库如何优化,尤其是历史温度数据计算品均值,实现小时,天,月的查询计算
  • Android和iOS DNS设置方式
  • C++链式调用与Builder模式
  • 【LightRAG:轻量级检索增强生成框架】
  • Femap许可转移操作指南
  • 思迅商慧7管理系统 信息泄露漏洞复现(CVE-2025-4281)
  • 适用于 Windows 和 Linux 的 Yolo全栈算法之开源项目学习
  • 【大模型原理与技术-毛玉仁】第二章 大语言模型架构
  • docker镜像加速
  • TestStand API编程:在SequenceFile中操作Sequence和Step
  • Jenkins-Pipeline:学习笔记
  • openbmc kvm Video 底层实现(1)之aspeed-video Module 初始化:
  • [yolov11改进系列]基于yolov11引入高效卷积模块SCConv减少冗余计算并提升特征学习的python源码+训练源码
  • MySQL主从复制深度解析:原理、配置与实战指南