当前位置: 首页 > news >正文

机器学习中的优化问题描述

文章目录

    • 机器学习中的优化问题描述
      • 局部最小vs全局最小
      • 凸集
      • 凸函数
      • 凸函数优化

参考

  • 李沐-优化算法

    https://www.bilibili.com/video/BV1bP4y1p7Gq?vd_source=7937b7ae341caaf55cd0ac02b03193a1

  • b站

    https://www.bilibili.com/video/BV1t47TzfE8R?vd_source=7937b7ae341caaf55cd0ac02b03193a1

机器学习中的优化问题描述

  • 一般形式
    m i n i m i z e f ( x ) s u b j e c t t o x ∈ C \mathbf{minimize}\quad f(x) \quad subject to \mathbf{x} \in C minimizef(x)subjecttoxC
  • 目标函数 f : R n → R f: \mathbb{R}^n \rightarrow \mathbb{R} f:RnR
  • 限制集合例子

C = { x ∣ h 1 ( x ) = 0 , … , h m ( x ) = 0 , g 1 ( x ) ≤ 0 , … , g r ( x ) ≤ 0 } C=\left\{\mathbf{x} \mid h_1(\mathbf{x})=0, \ldots, h_m(\mathbf{x})=0, g_1(\mathbf{x}) \leq 0, \ldots, g_r(\mathbf{x}) \leq 0\right\} C={xh1(x)=0,,hm(x)=0,g1(x)0,,gr(x)0}

  • 如果 C = R n C=\mathbb{R}^n C=Rn 那就是不受限

局部最小vs全局最小

  • 全局最小 x ∗ : f ( x ∗ ) ≤ f ( x ) ∀ x ∈ C \mathbf{x}^*: f\left(\mathbf{x}^*\right) \leq f(\mathbf{x}) \quad \forall \mathbf{x} \in C x:f(x)f(x)xC

  • 局部最小 x ∗ \mathbf{x}^* x :存在 ε \varepsilon ε ,使得 f ( x ∗ ) ≤ f ( x ) ∀ x : ∥ x − x ∗ ∥ ≤ ε f\left(\mathbf{x}^*\right) \leq f(\mathbf{x}) \quad \forall \mathbf{x}:\left\|\mathbf{x}-\mathbf{x}^*\right\| \leq \varepsilon f(x)f(x)x:xxε

  • 使用迭代优化算法来求解,一般只能保证找到局部最小image-20250606223331259

凸集

  • 一个 R n \mathbb{R}^n Rn 的子集 C C C 是凸当且仅当
    α x + ( 1 − α ) y ∈ C ∀ α ∈ [ 0 , 1 ] ∀ x , y ∈ C \begin{gathered} \alpha \mathbf{x}+(1-\alpha) \mathbf{y} \in C \\ \forall \alpha \in[0,1] \forall \mathbf{x}, \mathbf{y} \in C \end{gathered} αx+(1α)yCα[0,1]x,yC

  • 第一个是非凸的,后面两个是凸的image-20250606224208989

  • 两个凸集的交集是凸的image-20250606224316574

  • 两个凸集的并集不一定是凸的image-20250606224349435

凸函数

  • 函数 f : C → R f: C \rightarrow \mathbb{R} f:CR 是凸当且仅当

    f ( α x + ( 1 0 − α ) y ) ≤ α f ( x ) + ( 1 − α ) f ( y ) ∀ α ∈ [ 0 , 1 ] ∀ x , y ∈ C \begin{aligned} & f\left(\alpha \mathbf{x}+\left(1_0-\alpha\right) \mathbf{y}\right) \quad \leq \alpha f(\mathbf{x})+(1-\alpha) f(\mathbf{y}) \\ & \forall \alpha \in[0,1] \quad \forall \mathbf{x}, \mathbf{y} \in C \end{aligned} f(αx+(10α)y)αf(x)+(1α)f(y)α[0,1]x,yC

  • 如果 x ≠ y , α ∈ ( 0 , 1 ) \mathbf{x} \neq \mathbf{y}, \alpha \in(0,1) x=y,α(0,1) 时不等式严格成立那么叫严格凸函数image-20250606224858164

凸函数优化

  • 如果代价函数 f f f 是凸的,且限制集合 C C C 是凸的,那么就是凸优化问题,那么局部最小一定是全局最小

  • 严格凸优化问题有唯一的全局最小image-20250606225154022

  • 凸函数和非凸函数的例子

    凸函数

    • 线性回归 f ( x ) = ∣ ∣ W x − b ∣ ∣ 2 2 f(x) = ||Wx-b||^2_2 f(x)=∣∣Wxb22
    • Softmax回归

    非凸函数:其他

    • MLP、CNN、RNN、attention
http://www.xdnf.cn/news/962731.html

相关文章:

  • 在多云环境透析连接ngx_stream_proxy_protocol_vendor_module
  • ffmpeg 新版本转码设置帧率上限
  • 搭建gitlab ci/cd runner实现对c++项目的自动编译和打包
  • 51c嵌入式※~电路~合集32~PWM
  • 入门机器学习需要的统计基础
  • ArcGIS+AI:涵盖AI大模型应用、ArcGIS功能详解、Prompt技巧、AI助力的数据处理、空间分析、遥感分析、二次开发及综合应用等
  • 置信水平、置信区间
  • ArcGIS土地利用数据制备、分析及基于FLUS模型土地利用预测技术应用
  • 在Windows上搭建Kubernetes集群
  • 渗透靶场PortSwigger Labs指南:规范链接的反射XSS
  • Docker监控服务部署
  • 如何提升企微CRM系统数据的准确性?5大核心策略详解
  • 鹰盾加密器基于AI的视频个性化压缩技术深度解析:从智能分析到无损压缩实践
  • 鹰盾加密器的超混沌加密原理深度解析:从理论基础到视频应用
  • AWS WebRTC 使用SDK-C demo 实现master推流和viewer拉流
  • 后进先出(LIFO)详解
  • [科研理论]无人机底层控制算法PID、LQR、MPC解析
  • 土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测技术应用
  • OOM模拟排查过程记录
  • 火山引擎大模型系列可以用来作什么
  • TDengine 快速体验(云服务方式)
  • ceph集群调整pg数量实战(上)
  • TikTok矩阵养号实战:住宅IP纯净度与设备指纹联动方案
  • 空间注意力机制
  • uniapp开发小程序vendor.js 过大
  • 使用java实现蒙特卡洛模拟风险预测功能
  • AI一周事件(2025年6月3日-6月9日)
  • WHAT - 组件库单入口打包和多入口打包
  • “液态玻璃”难解苹果AI焦虑:WWDC25背后的信任危机
  • 自动化三维扫描检测赋能汽车铸造件高效检测