当前位置：首页 > news >正文

损失函数的等高线与参数置零的关系

news 2025/7/18 12:48:09

文章目录

1. 什么是等高线？
2. 等高线的形状差异
3. 逐步理解优化过程
- 步骤1: 理解问题设置
- 步骤2: 等高线的作用
- 步骤3: 优化策略
- 步骤4: 坐标轴交点的特殊性
4. 核心理解

1. 什么是等高线？

损失函数的等高线就像地形图一样，连接所有损失值相同的点：

每条等高线上的所有点都有相同的损失值
内层等高线损失小，外层等高线损失大
我们的目标是找到最内层的等高线（最小损失）

2. 等高线的形状差异

MAE: |θ₁| + |θ₂| = 常数 → 菱形
MSE: θ₁² + θ₂² = 常数 → 圆形
在这里插入图片描述

3. 逐步理解优化过程

步骤1: 理解问题设置

假设我们要找到最优参数 θ₁ 和 θ₂，使得损失函数最小。真实的最优解是红色点。

$目标：找到 θ_{1}, θ_{2} 使得 L oss (θ_{1}, θ_{2}) 最小$

步骤2: 等高线的作用

等高线告诉我们：同一条等高线上的所有点都有相同的损失值。

内层等高线：损失值较小（更接近最优）
外层等高线：损失值较大（远离最优）

步骤3: 优化策略

优化算法的目标是找到最内层的等高线（最小损失）。但是：
$关键洞察：当我们添加约束（如 L 1 正则化）时，我们不能选择任意点，而是要在约束区域内找到损失最小的点。$

步骤4: 坐标轴交点的特殊性

坐标轴上的点有特殊含义：

θ₁轴上的点：θ₂ = 0（第二个参数被置零）
θ₂轴上的点：θ₁ = 0（第一个参数被置零）

这就是稀疏性的来源！

特征	MAE (L1)	MSE (L2)
等高线形状	菱形（有尖角）	圆形（平滑）
坐标轴交点	在每条等高线的顶点	很少有明显交点
优化结果	倾向于选择坐标轴上的点	很少选择坐标轴上的点
参数特性	部分参数为零（稀疏）	所有参数都非零（密集）

4. 核心理解

MAE的等高线在坐标轴上形成"尖角"，这些尖角恰好是某个参数为零的位置。当优化算法寻找最小损失时，这些尖角成为自然的"候选点"。如果这些点的损失足够小，算法就会选择它们，从而实现参数置零。

http://www.xdnf.cn/news/1138465.html

相关文章：

从AWS MySQL数据库下载备份到S3的完整解决方案

Linux操作系统之线程：线程概念

mongodb-org-mongos : Depends: libssl1.1 (＞= 1.1.1) but it is not installable

Java使用FastExcel实现Excel文件导入

镁合金汽车零部件市场报告：行业现状、发展趋势与投资前景分析

集群聊天服务器各个类进行详解

Docker国内镜像

关于用git上传远程库的一些常见命令使用和常见问题：

RuoYi-Cloud 定制微服务

Java集合框架中List常见问题

【软件开发】主流 AI 编码插件

服务器数据恢复—raid5磁盘阵列崩溃如何恢复数据？

《每日AI-人工智能-编程日报》--2025年7月17日

Odoo最佳业务实践：从库存管理重构到全链路协同

Jmeter 性能测试响应时间过长怎么办？

下载anaconda和pycharm，管理python环境

Kubernetes 学习笔记

暑期自学嵌入式——Day05（C语言阶段）

MyBatis 之配置与映射核心要点解析

三轴云台之测距算法篇

硅谷顶级风投发布《2025年AI实战手册》｜附下载

【Elasticsearch】Elasticsearch 快照恢复 API 参数详解

一次多架构镜像构建实战：Docker Buildx + Harbor 踩坑记录

arping（ARP协议网络测试工具）

ota之.加密算法，mcu加密方式

git基本操作【GIT-2】

进阶向:智能图像背景移除工具

Java并发编程第三篇（深入解析Synchronized）

2025年5大国产ETL工具横向评测

20250717 Ubuntu 挂载远程 Windows 服务器上的硬盘