机器学习中的优化问题描述
文章目录
- 机器学习中的优化问题描述
- 局部最小vs全局最小
- 凸集
- 凸函数
- 凸函数优化
参考
-
李沐-优化算法
https://www.bilibili.com/video/BV1bP4y1p7Gq?vd_source=7937b7ae341caaf55cd0ac02b03193a1
-
b站
https://www.bilibili.com/video/BV1t47TzfE8R?vd_source=7937b7ae341caaf55cd0ac02b03193a1
机器学习中的优化问题描述
- 一般形式
m i n i m i z e f ( x ) s u b j e c t t o x ∈ C \mathbf{minimize}\quad f(x) \quad subject to \mathbf{x} \in C minimizef(x)subjecttox∈C
- 目标函数 f : R n → R f: \mathbb{R}^n \rightarrow \mathbb{R} f:Rn→R
- 限制集合例子
C = { x ∣ h 1 ( x ) = 0 , … , h m ( x ) = 0 , g 1 ( x ) ≤ 0 , … , g r ( x ) ≤ 0 } C=\left\{\mathbf{x} \mid h_1(\mathbf{x})=0, \ldots, h_m(\mathbf{x})=0, g_1(\mathbf{x}) \leq 0, \ldots, g_r(\mathbf{x}) \leq 0\right\} C={x∣h1(x)=0,…,hm(x)=0,g1(x)≤0,…,gr(x)≤0}
- 如果 C = R n C=\mathbb{R}^n C=Rn 那就是不受限
局部最小vs全局最小
-
全局最小 x ∗ : f ( x ∗ ) ≤ f ( x ) ∀ x ∈ C \mathbf{x}^*: f\left(\mathbf{x}^*\right) \leq f(\mathbf{x}) \quad \forall \mathbf{x} \in C x∗:f(x∗)≤f(x)∀x∈C
-
局部最小 x ∗ \mathbf{x}^* x∗ :存在 ε \varepsilon ε ,使得 f ( x ∗ ) ≤ f ( x ) ∀ x : ∥ x − x ∗ ∥ ≤ ε f\left(\mathbf{x}^*\right) \leq f(\mathbf{x}) \quad \forall \mathbf{x}:\left\|\mathbf{x}-\mathbf{x}^*\right\| \leq \varepsilon f(x∗)≤f(x)∀x:∥x−x∗∥≤ε
-
使用迭代优化算法来求解,一般只能保证找到局部最小
凸集
-
一个 R n \mathbb{R}^n Rn 的子集 C C C 是凸当且仅当
α x + ( 1 − α ) y ∈ C ∀ α ∈ [ 0 , 1 ] ∀ x , y ∈ C \begin{gathered} \alpha \mathbf{x}+(1-\alpha) \mathbf{y} \in C \\ \forall \alpha \in[0,1] \forall \mathbf{x}, \mathbf{y} \in C \end{gathered} αx+(1−α)y∈C∀α∈[0,1]∀x,y∈C -
第一个是非凸的,后面两个是凸的
-
两个凸集的交集是凸的
-
两个凸集的并集不一定是凸的
凸函数
-
函数 f : C → R f: C \rightarrow \mathbb{R} f:C→R 是凸当且仅当
f ( α x + ( 1 0 − α ) y ) ≤ α f ( x ) + ( 1 − α ) f ( y ) ∀ α ∈ [ 0 , 1 ] ∀ x , y ∈ C \begin{aligned} & f\left(\alpha \mathbf{x}+\left(1_0-\alpha\right) \mathbf{y}\right) \quad \leq \alpha f(\mathbf{x})+(1-\alpha) f(\mathbf{y}) \\ & \forall \alpha \in[0,1] \quad \forall \mathbf{x}, \mathbf{y} \in C \end{aligned} f(αx+(10−α)y)≤αf(x)+(1−α)f(y)∀α∈[0,1]∀x,y∈C
-
如果 x ≠ y , α ∈ ( 0 , 1 ) \mathbf{x} \neq \mathbf{y}, \alpha \in(0,1) x=y,α∈(0,1) 时不等式严格成立那么叫严格凸函数
凸函数优化
-
如果代价函数 f f f 是凸的,且限制集合 C C C 是凸的,那么就是凸优化问题,那么局部最小一定是全局最小
-
严格凸优化问题有唯一的全局最小
-
凸函数和非凸函数的例子
凸函数
- 线性回归 f ( x ) = ∣ ∣ W x − b ∣ ∣ 2 2 f(x) = ||Wx-b||^2_2 f(x)=∣∣Wx−b∣∣22
- Softmax回归
非凸函数:其他
- MLP、CNN、RNN、attention