当前位置: 首页 > java >正文

机器学习-入门-线性模型(1)

机器学习-入门-线性模型(1)

文章目录

  • 机器学习-入门-线性模型(1)
    • 3.1 线性回归
    • 3.2 最小二乘解
    • 3.3 多元线性回归

3.1 线性回归

f ( x i ) = w x i + b 使得 f ( x i ) ≃ y i f(x_i) = wx_i + b \quad \text{使得} \quad f(x_i) \simeq y_i f(xi)=wxi+b使得f(xi)yi

离散属性的处理:若有"序"(order),则连续化;否则,转化为 k k k 维向量

令均方误差最小化,有:

( w ∗ , b ∗ ) = arg ⁡ min ⁡ ( w , b ) ∑ i = 1 m ( f ( x i ) − y i ) 2 = arg ⁡ min ⁡ ( w , b ) ∑ i = 1 m ( y i − w x i − b ) 2 (w^*, b^*) = \arg\min_{(w, b)} \sum_{i=1}^m (f(x_i) - y_i)^2 = \arg\min_{(w, b)} \sum_{i=1}^m (y_i - wx_i - b)^2 (w,b)=arg(w,b)mini=1m(f(xi)yi)2=arg(w,b)mini=1m(yiwxib)2

E ( w , b ) = ∑ i = 1 m ( y i − w x i − b ) 2 E(w, b) = \sum_{i=1}^m (y_i - wx_i - b)^2 E(w,b)=i=1m(yiwxib)2 进行最小二乘参数估计

3.2 最小二乘解

E ( w , b ) = ∑ i = 1 m ( y i − w x i − b ) 2 E_{(w,b)} = \sum_{i=1}^m (y_i - wx_i - b)^2 E(w,b)=i=1m(yiwxib)2

分别对 w w w b b b 求导:

∂ E ( w , b ) ∂ w = 2 ( w ∑ i = 1 m x i 2 − ∑ i = 1 m ( y i − b ) x i ) \frac{\partial E_{(w,b)}}{\partial w} = 2 \left( w \sum_{i=1}^m x_i^2 - \sum_{i=1}^m (y_i - b)x_i \right) wE(w,b)=2(wi=1mxi2i=1m(yib)xi)

∂ E ( w , b ) ∂ b = 2 ( m b − ∑ i = 1 m ( y i − w x i ) ) \frac{\partial E_{(w,b)}}{\partial b} = 2 \left( mb - \sum_{i=1}^m (y_i - wx_i) \right) bE(w,b)=2(mbi=1m(yiwxi))

令导数为 0,得到闭式(closed-form)解:

w = ∑ i = 1 m y i ( x i − x ˉ ) ∑ i = 1 m x i 2 − 1 m ( ∑ i = 1 m x i ) 2 b = 1 m ∑ i = 1 m ( y i − w x i ) w = \frac{\sum_{i=1}^m y_i (x_i - \bar{x})}{\sum_{i=1}^m x_i^2 - \frac{1}{m} \left( \sum_{i=1}^m x_i \right)^2} \quad b = \frac{1}{m} \sum_{i=1}^m (y_i - wx_i) w=i=1mxi2m1(i=1mxi)2i=1myi(xixˉ)b=m1i=1m(yiwxi)

3.3 多元线性回归

同样采用最小二乘法求解,有

w ∗ = arg ⁡ min ⁡ w ( y − X w ) T ( y − X w ) w^* = \arg\min_{w} (y - Xw)^T (y - Xw) w=argwmin(yXw)T(yXw)

E w = ( y − X w ) T ( y − X w ) E_w = (y - Xw)^T (y - Xw) Ew=(yXw)T(yXw),对 w w w 求导:

∂ E w ∂ w = 2 X T ( X w − y ) \frac{\partial E_w}{\partial w} = 2X^T (Xw - y) wEw=2XT(Xwy)

令其为零可得 w w w

然而,麻烦来了:涉及矩阵求逆!

  • X T X X^T X XTX 满秩或正定,则 w ∗ = ( X T X ) − 1 X T y w^* = (X^T X)^{-1} X^T y w=(XTX)1XTy
  • X T X X^T X XTX 不满秩,则可解出多个 w w w

若可解出多个解,可以引入正则化得到唯一解

http://www.xdnf.cn/news/2348.html

相关文章:

  • 量子纠缠式架构:当微服务同时存在于所有节点时,CAP定理是否依然成立?
  • R中实现数值求导的包numDeriv
  • deepSeek浅谈对vue的mixin的理解,用于什么应用场景?
  • 探索DeepWiki:GitHub源码阅读的变革性工具
  • 从零构建云原生秒杀系统——后端架构与实战
  • Win10安装 P104-100 驱动
  • 衡量矩阵数值稳定性的关键指标:矩阵的条件数
  • Golang | 搜索表达式
  • 【c++】AVL树模拟实现
  • 从基础到实战的量化交易全流程学习:1.3 数学与统计学基础——概率与统计基础 | 基础概念
  • 深入详解人工智能数学基础—概率论-KL散度在变分自编码器(VAE)中的应用
  • 驯龙日记:用Pandas驾驭数据的野性
  • 《2025全球机器学习技术大会:阿里云讲师张玉明深度剖析通义灵码AI程序员》
  • prometheus手动添加k8s集群外的node-exporter监控
  • 国家与省市县 标准地图服务网站 审图号地图下载
  • 【Redis】zset类型
  • 本安型交换机 + TSN:煤矿智能化的关键拼图
  • 2025蓝桥杯省赛网络安全组wp
  • 无人机超声波避障技术要点与难点!
  • 火语言RPA--钉钉群通知
  • 【Web API系列】深入解析 Web Service Worker 中的 WindowClient 接口:原理、实践与进阶应用
  • LCD1602液晶显示屏详解(STM32)
  • Python爬虫(8)Python数据存储实战:JSON文件读写与复杂结构化数据处理指南
  • 纯净无噪,智见未来——MAGI-1本地部署教程,自回归重塑数据本质
  • Redis03-基础-C#客户端
  • Hyper-V安装Win10系统,报错“No operating system was loaded“
  • Java大厂面试突击:从Spring Boot自动配置到Kafka分区策略实战解析
  • Java详解LeetCode 热题 100(01):LeetCode 1. 两数之和(Two Sum)详解
  • UEC++第13天| 字体集、UEC中的 -> :: .
  • Linux操作系统从入门到实战(四)Linux基础指令(下)