当前位置: 首页 > java >正文

损失函数,及其优化方法

什么是损失函数? (去计算损失值的函数)

损失函数,也称为代价函数,是一个用来​​衡量机器学习模型预测结果与真实值之间差距​​的函数。

任务类型

默认首选损失函数

关键考量

回归

均方误差 (MSE)​

最通用。如果数据中有很多异常值,考虑 ​MAE​ 或 ​Huber Loss

二分类

二分类交叉熵 (BCE)​

与Sigmoid激活函数配对使用。

多分类

多分类交叉熵 (CE)​

绝对主流,与Softmax激活函数配对使用。

SVM分类

合页损失 (Hinge)​

SVM的专属损失。

类别极端不平衡

Focal Loss

基于交叉熵改进,是解决不平衡问题的“高级武器”。

小结:交叉熵损失因其能提供与误差直接成正比的强大梯度,彻底解决了分类模型中使用Sigmoid/Softmax层时带来的梯度消失问题,从而极大地加快了训练速度,这是它成为绝对主流的根本原因。​

为什么交叉熵损失就非常适合分类问题,均方误差MSE很适合回归问题呢? 

特性

均方误差 (MSE)

交叉熵 (Cross-Entropy)

任务

回归​ (预测连续值)

分类​ (预测概率分布)

梯度性质

梯度与误差 (y_pred - y_true)成正比

梯度与误差 (y_pred - y_true)成正比

核心优势

优化过程稳定,符合高斯噪声假设

为分类模型提供强大、有效的梯度,避免梯度消失

概率解释

等价于高斯分布下的最大似然估计

等价于多项分布下的最大似然估计

错误选择后果

在分类问题上导致训练缓慢甚至无法收敛

在回归问题上假设不对,且优化性质不佳

损失函数的优化方法有哪些,各自优缺点是什么,他们的应用范围是什么?(即 得到了损失值后怎么优化)

方法类别

代表算法

核心思想

优点

缺点

主要应用场景

​一阶迭代法​

​梯度下降​​及其变种(SGD, Adam)

利用一阶导数(梯度)指引下降方向

简单、可扩展,适用于大规模问题

可能收敛慢、陷入局部最优

​深度学习的主力军​

​二阶迭代法​

牛顿法、L-BFGS

利用二阶导数(曲率)提供更精确的更新方向和步长

收敛速度极快

计算成本极高,对大规模问题不可行

传统小规模机器学习模型

​无导数方法​

贝叶斯优化、进化算法

通过采样、概率模型或种群进化来搜索最优解,不依赖梯度

不要求可导,擅长全局搜索

计算成本高,收敛慢

超参数调优、NAS、强化学习、不可导问题

​解析法​

正规方程

直接令梯度为零解方程

一步得到精确解

仅适用于极少数有解析解的简单模型

线性回归

http://www.xdnf.cn/news/19046.html

相关文章:

  • JS中的String总结
  • 2002-2020年全国投入产出表数据
  • Python 中的反射机制与动态灵活性
  • 实测阿里图像编辑模型Qwen-Image-Edit:汉字也能无痕修改(附实测案例)
  • react+vite+ts 组件模板
  • DAY-16-数组的常见操作和形状-2025.8.28
  • FISCO-BCOS-Python 模板
  • RAG概念被误用:AI应用落地需回归上下文工程本质
  • 解锁AI“黑匣”:监督、无监督与强化学习探秘
  • 切入高潜市场,抢占行业先机!ES SHOW 2025展位预订火爆,10月28-30日共启增长新蓝海
  • flutter Function和自定义的Callback有什么区别?
  • 自动化三维测量仪工业零件自动外观三维测量-中科米堆CASAIM
  • Linux系统资源分配算法在VPS云服务器调优-性能优化全指南
  • 【DAB收音机】DAB 信号发生器介绍
  • C++源代码批量转码utf8
  • SystemVerilog学习【六】功能覆盖率详解
  • 【动态规划】简单多状态 dp 问题
  • 【lucene】advanceShallow (int target) 与advance(int target)
  • Kea DHCP高危漏洞CVE-2025-40779:单个数据包即可导致服务器崩溃
  • workflow/http_parser源码解密:HTTP解析器的双倍扩容与零拷贝策略
  • R 语言 eulerr 包绘制韦恩图:比例精准
  • 机器学习(讲解)
  • 使用MySQL计算斐波那契数列
  • 开源工具新玩法:cpolar提升Penpot协作流畅度
  • Spark入门:从零到能跑的实战教程
  • 基于Spring Session + Redis + JWT的单点登录实现
  • 在Ubuntu中安装配置MySql Server
  • [p2p-Magnet] docs | HTTP API与Web界面 | 搜索查询引擎
  • PyTorch 张量核心知识点
  • 引入资源即针对于不同的屏幕尺寸,调用不同的css文件