当前位置: 首页 > news >正文

epoch、batch size和steps_per_epoch的区别

在深度学习训练过程中,epochbatch sizesteps_per_epoch是三个关键概念,它们的区别和关系如下:


1.Epoch(训练轮次)

  • 定义‌:1个epoch表示模型完整遍历‌整个训练数据集一次(所有样本都被模型学习过一遍)。
  • 作用‌:通常需要多个epoch(如50、100轮)让模型充分学习数据特征。
  • 示例‌:若训练集有1000个样本,1个epoch即模型看过这1000个样本一次。

2.Batch Size(批大小)

  • 定义‌:每次迭代(step)时‌一次性输入模型的样本数量
  • 作用‌:
    • 内存效率:批量处理减少内存占用(相比单样本训练)。
    • 梯度稳定性:批量数据的梯度均值更稳定(相比随机梯度下降)。
  • 示例‌:若batch
http://www.xdnf.cn/news/362701.html

相关文章:

  • Linux 大于2T磁盘分区
  • FPGA 41 ,ICMP 协议详细解析之构建网络诊断系统( ICMP 协议与 IP 协议理论详细解析 )
  • windows下,docker虚拟化使用nginx镜像部署vue3+vite项目
  • 数据库基础:概念、原理与实战示例
  • 多账号管理与自动化中的浏览器指纹对抗方案
  • 北斗导航 | RTKLib中重难点技术,公式,代码
  • 【质量管理】TRIZ因果链分析:解码质量问题的“多米诺效应“
  • 20250509——TOPSIS计算各方案得分
  • 怎么判断是不是公网IP?如何查看自己本地路由器是内网ip还是公网?
  • Lightweight App Alternatives
  • gpu硬件,gpu驱动,cuda,CUDA Toolkit,cudatoolkit,cudnn,nvcc概念解析
  • python---kafka常规使用
  • awesome-digital-human本地部署及配置:打造高情绪价值互动指南
  • Conda激活环境无效
  • 【星海随笔】信息安全相关标准
  • 江西同为科技有限公司受邀参展2025长江流域跨博会
  • 智芯Z20K144x MCU开发之时钟架构
  • 数字人肢体动作控制:从基础原理到实践路径!
  • PostgreSQL可见性映射VM
  • 3D模型格式转换组件HOOPS Exchange:高效赋能航空航天设计协同、数据一致!
  • Uniapp app 安卓手机(红米)自定义基座进行真机调试
  • 编译原理实验 之 语法分析程序自动生成工具Yacc实验
  • 【TACD模拟】质子辐照对GaN器件临界电压增加的影响机制
  • 大疆无人机搭载树莓派进行目标旋转检测
  • 【Python】‌Python单元测试框架unittest总结
  • 基于Llama3的开发应用(一):Llama模型的简单部署
  • 专业级 GIF 制作工具深度解析:Gifski 与 GIPHY CAPTURE 的技术对比与实战指南
  • 【报错】AttributeError: ‘float‘ object has no attribute ‘backward‘
  • @PostConstruct @PreDestroy
  • 在 Envoy 的配置文件中出现的 “@type“ 字段