当前位置: 首页 > news >正文

损失函数的等高线与参数置零的关系

文章目录

  • 1. 什么是等高线?
  • 2. 等高线的形状差异
  • 3. 逐步理解优化过程
    • 步骤1: 理解问题设置
    • 步骤2: 等高线的作用
    • 步骤3: 优化策略
    • 步骤4: 坐标轴交点的特殊性
  • 4. 核心理解

1. 什么是等高线?

损失函数的等高线就像地形图一样,连接所有损失值相同的点:

  1. 每条等高线上的所有点都有相同的损失值
  2. 内层等高线损失小,外层等高线损失大
  3. 我们的目标是找到最内层的等高线(最小损失)

2. 等高线的形状差异

MAE: |θ₁| + |θ₂| = 常数 → 菱形
MSE: θ₁² + θ₂² = 常数 → 圆形
在这里插入图片描述

3. 逐步理解优化过程

步骤1: 理解问题设置

假设我们要找到最优参数 θ₁ 和 θ₂,使得损失函数最小。真实的最优解是红色点。

目标:找到θ1,θ2使得Loss(θ1,θ2)最小目标:找到 θ₁, θ₂ 使得 Loss(θ₁, θ₂) 最小 目标:找到θ1,θ2使得Loss(θ1,θ2)最小

步骤2: 等高线的作用

等高线告诉我们:同一条等高线上的所有点都有相同的损失值。

  • 内层等高线:损失值较小(更接近最优)
  • 外层等高线:损失值较大(远离最优)

步骤3: 优化策略

优化算法的目标是找到最内层的等高线(最小损失)。但是:
关键洞察:当我们添加约束(如L1正则化)时,我们不能选择任意点,而是要在约束区域内找到损失最小的点。关键洞察:当我们添加约束(如L1正则化)时,我们不能选择任意点, 而是要在约束区域内找到损失最小的点。 关键洞察:当我们添加约束(如L1正则化)时,我们不能选择任意点,而是要在约束区域内找到损失最小的点。

步骤4: 坐标轴交点的特殊性

坐标轴上的点有特殊含义:

  • θ₁轴上的点:θ₂ = 0(第二个参数被置零)
  • θ₂轴上的点:θ₁ = 0(第一个参数被置零)

这就是稀疏性的来源!

特征MAE (L1)MSE (L2)
等高线形状菱形(有尖角)圆形(平滑)
坐标轴交点在每条等高线的顶点很少有明显交点
优化结果倾向于选择坐标轴上的点很少选择坐标轴上的点
参数特性部分参数为零(稀疏)所有参数都非零(密集)

4. 核心理解

MAE的等高线在坐标轴上形成"尖角",这些尖角恰好是某个参数为零的位置。 当优化算法寻找最小损失时,这些尖角成为自然的"候选点"。 如果这些点的损失足够小,算法就会选择它们,从而实现参数置零。

http://www.xdnf.cn/news/1138465.html

相关文章:

  • 从AWS MySQL数据库下载备份到S3的完整解决方案
  • Linux操作系统之线程:线程概念
  • mongodb-org-mongos : Depends: libssl1.1 (>= 1.1.1) but it is not installable
  • Java使用FastExcel实现Excel文件导入
  • 镁合金汽车零部件市场报告:行业现状、发展趋势与投资前景分析
  • 集群聊天服务器各个类进行详解
  • Docker国内镜像
  • 关于用git上传远程库的一些常见命令使用和常见问题:
  • RuoYi-Cloud 定制微服务
  • Java集合框架中List常见问题
  • 【软件开发】主流 AI 编码插件
  • 服务器数据恢复—raid5磁盘阵列崩溃如何恢复数据?
  • 《每日AI-人工智能-编程日报》--2025年7月17日
  • Odoo最佳业务实践:从库存管理重构到全链路协同
  • Jmeter 性能测试响应时间过长怎么办?
  • 下载anaconda和pycharm,管理python环境
  • Kubernetes 学习笔记
  • 暑期自学嵌入式——Day05(C语言阶段)
  • MyBatis 之配置与映射核心要点解析
  • 三轴云台之测距算法篇
  • 硅谷顶级风投发布《2025年AI实战手册》|附下载
  • 【Elasticsearch】Elasticsearch 快照恢复 API 参数详解
  • 一次多架构镜像构建实战:Docker Buildx + Harbor 踩坑记录
  • arping(ARP协议网络测试工具)
  • ota之.加密算法,mcu加密方式
  • git基本操作【GIT-2】
  • 进阶向:智能图像背景移除工具
  • Java并发编程第三篇(深入解析Synchronized)
  • 2025年5大国产ETL工具横向评测
  • 20250717 Ubuntu 挂载远程 Windows 服务器上的硬盘