当前位置: 首页 > news >正文

什么是最小二乘法

引言:一场跨越200年的科学较量

1801年,当意大利天文学家皮亚齐发现谷神星后,全欧洲科学家都试图通过他观测的40天数据预测这颗小行星的轨道。在众多失败者中,一位24岁的德国数学家高斯用一种新方法成功计算出了谷神星的轨迹,这就是后来改变科学界的最小二乘法。今天,这个方法已渗透到经济学、工程学、机器学习等各个领域,成为数据拟合的基石。

一、最小二乘法的核心思想(通俗版)

想象你正在射箭,箭靶上的散落箭矢代表观测数据,而最小二乘法就是帮你找到一条直线,使得所有箭矢到这条直线的垂直距离的平方和最小。用数学语言来说:

  • 给定n个数据点((x_i, y_i))
  • 寻找直线(y = ax + b)
  • 最小化目标函数:(E = \sum_{i=1}^n (y_i - (ax_i + b))^2)

二、数学推导:从弹簧到方程组

弹簧理论(物理直观)

把每个数据点与拟合线的垂直距离想象成弹簧,弹簧的弹力与形变量成正比。当系统平衡时,所有弹簧的合力为零,这对应数学上的偏导数为零的条件。

代数解法(三步走)

  1. 设定目标函数:(E = \sum (y_i - ax_i - b)^2)
  2. 对参数求偏导
    [
    \frac{\partial E}{\partial a} = -2\sum x_i(y_i - ax_i - b) = 0 \
    \frac{\partial E}{\partial b} = -2\sum (y_i - ax_i - b) = 0
    ]
  3. 解方程组
    整理后得到法方程组:
    [
    \begin{cases}
    a\sum x_i^2 + b\sum x_i = \sum x_iy_i \
    a\sum x_i + bn = \sum y_i
    \end{cases}
    ]
    解得:
    [
    a = \frac{n\sum x_iy_i - \sum x_i\sum y_i}{n\sum x_i^2 - (\sum x_i)^2} \
    b = \frac{\sum y_i - a\sum x_i}{n}
    ]

矩阵解法(进阶)

用矩阵形式表达更简洁:
[
\boldsymbol{X}\boldsymbol{\beta} = \boldsymbol{y} \quad \Rightarrow \quad \boldsymbol{\beta} = (\boldsymbol{X}T\boldsymbol{X}){-1}\boldsymbol{X}^T\boldsymbol{y}
]
其中(\boldsymbol{\beta})是参数向量,(\boldsymbol{X})是设计矩阵。

三、应用案例:从天文学到经济学

案例1:谷神星轨道预测(历史经典)

高斯用最小二乘法处理皮亚齐的20次观测数据,计算出谷神星轨道参数,误差仅0.02弧度。这一成就使他在24岁成为哥廷根大学教授。

案例2:商场销售预测(现代应用)

某商场记录2000年皮鞋月销量(单位:双):

月份1月2月3月12月
销量1325166215572864

用最小二乘法拟合直线(y=2088+72x)(x为月份),预测2004年第一季度销量达3024双,实际销售验证误差仅2.3%。

代码示例(Python实现)

import numpy as np
import matplotlib.pyplot as plt# 生成模拟数据
x = np.array([1,2,3,4,5])
y = np.array([2,3,5,4,6])# 计算参数
A = np.vstack([x, np.ones(len(x))]).T
a, b = np.linalg.lstsq(A, y, rcond=None)[0]# 绘图
plt.scatter(x, y, color='blue')
plt.plot(x, a*x + b, color='red')
plt.title(f'拟合直线: y = {a:.2f}x + {b:.2f}')
plt.show()

四、优缺点:硬币的两面

四大优势

  1. 计算高效:解析解直接可得,无需迭代
  2. 理论基础坚实:在正态误差下是最优无偏估计
  3. 适用广泛:从线性回归到多项式拟合
  4. 易于理解:几何意义直观(残差平方和最小)

三大局限

  1. 异常值敏感:一个异常点可能彻底改变结果
  2. 线性假设:对非线性关系需扩展(如多项式回归)
  3. 矩阵求逆风险:当设计矩阵病态时,结果不稳定

五、总结与互动

总结

最小二乘法用数学之美解决了数据拟合的核心问题:在不确定性中寻找最优解。从高斯预测谷神星到现代机器学习,它始终是连接理论与现实的桥梁。

http://www.xdnf.cn/news/1382869.html

相关文章:

  • 二、开关电源的EMC改善措施
  • CVPR2025丨VL2Lite:如何将巨型VLM的“知识”精炼后灌入轻量网络?这项蒸馏技术实现了任务专用的极致压缩
  • 虚幻基础:角色变换角色视角蒙太奇运动
  • 基于SpringBoot的老年人健康数据远程监控管理系统【2026最新】
  • 嵌入式开发学习———Qt软件环境下的C++学习(七)
  • 图论基础篇
  • Mybatis中缓存机制的理解以及优缺点
  • 微服务相关面试题
  • stable-baseline3介绍
  • 个人博客运行3个月记录
  • mac m4执行nvm install 14.19.1报错,安装低版本node报错解决
  • 【STM32】G030单片机的窗口看门狗
  • Flutter:ios打包ipa,证书申请,Xcode打包,完整流程
  • LeetCode Hot 100 第7天
  • mac系统本地部署Dify步骤梳理
  • 仓颉编程语言青少年基础教程:输入输出
  • 模拟实现Linux中的进度条
  • [Mysql数据库] 知识点总结5
  • 天津医科大学肿瘤医院冷热源群控系统调试完成:以 “精准控温 + 高效节能” 守护医疗核心场景
  • 实战演练(一):从零构建一个功能完备的Todo List应用
  • Spring事务管理机制深度解析:从JDBC基础到Spring高级实现
  • 力扣(LeetCode) ——965. 单值二叉树(C语言)
  • C#写的一键自动测灯带的应用 AI帮写的。
  • [灵动微电子 MM32BIN560CN MM32SPIN0280]读懂电机MCU之串口DMA
  • list 手动实现 1
  • 学习日志40 python
  • 微服务即时通信系统(十三)--- 项目部署
  • 【后端】微服务后端鉴权方案
  • 虚函数指针和虚函数表的创建时机和存放位置
  • 【Linux知识】Linux 设置账号密码永不过期