当前位置: 首页 > ds >正文

损失函数和调度器相关类代码回顾理解 |nn.CrossEntropyLoss\CosineAnnealingLR

目录

nn.CrossEntropyLoss

CosineAnnealingLR


nn.CrossEntropyLoss

loss_func = nn.CrossEntropyLoss(reduction="sum")

定义nn.CrossEntropyLoss交叉熵损失函数,reduction参数设置为"sum",表示将所有样本的损失相加。reduction 参数用于指定如何对损失进行归约,有三个可能的值:"none"、"mean" 和 "sum"。选择=“sum”,即输出损失将被求和。由于分批处理数据,因此将返回每批数据的损失值之和。

CosineAnnealingLR

lr_scheduler = CosineAnnealingLR(opt,T_max=2,eta_min=1e-5)

创建学习率调度器,T_max表示周期长度,eta_min表示最小学习率。该调度器基于cosine annealing schedule余弦退火方法来调整学习率。余弦退火学习率调整策略是一种常用的学习率调整策略,它会在训练过程中逐渐减小学习率,直到达到一个最小值。这里的学习率将从优化器设定值lr=1e-4开始,逐渐向最小值eta_min=1e-5减小,并在2*T_max=4次迭代中返回到原始设定值。

http://www.xdnf.cn/news/16973.html

相关文章:

  • 1 前言:什么是 CICD 为什么要学 CICD
  • Java试题-选择题(3)
  • (28)运动目标检测之随机曲线上的离散点进行插值
  • 利用CompletableFuture优化查询效率
  • Android Material Components 全面解析:打造现代化 Material Design 应用
  • Prim算法
  • javascript中call、apply 和 bind 的区别详解
  • 2025新征程杯全国54校园足球锦标赛在北京世园公园隆重开幕
  • qt贝塞尔曲线演示工具
  • Nestjs框架: 请求生命周期与应用生命周期
  • Java向量化
  • python列表推导式
  • Android Frameworks从零开始
  • codex体验失败记录
  • 删除MicroGame
  • 基于单片机汽车少儿安全预警系统
  • 【PyTorch✨】01 初识PyTorch
  • 自动驾驶的未来:多模态传感器钻机
  • SQL中的HAVING用法
  • ICML 2025 | 深度剖析时序 Transformer:为何有效,瓶颈何在?
  • ZYNQ与MPSoC实战:从Vitis入门到项目开发
  • Uniapp 验证 HTTPS 协议
  • JVM指针压缩的那些事
  • 永洪科技华西地区客户交流活动成功举办!以AI之力锚定增长确定性
  • 15day-人工智学习-机器学习-介绍和定义
  • vue+element 实现下拉框共享options
  • HFSS许可管理自动化工具
  • JAVA并发编程工具
  • [echarts] 更新数据
  • ForCenNet:文档图矫正迎来新SOTA(2025)