切比雪夫不等式的理解以及推导【超详细笔记】
文章目录
- 参考教程
- 一、意义
- 1. 正态分布的 3σ 法则
- 2. 不等式的含义
- 3. 不等式的意义
- 二、不等式的证明
- 1. 马尔科夫不等式
- 2. 切比雪夫不等式推导
参考教程
一个视频,彻底理解切比雪夫不等式
一、意义
1. 正态分布的 3σ 法则
- 不等式:切比雪夫不等式 P{∣X−EX∣≥ε}≤DXε2P\{|X - EX| \geq \varepsilon\} \leq \frac{DX}{\varepsilon^2}P{∣X−EX∣≥ε}≤ε2DX,用于描述随机变量偏离期望的概率上界
- 法则:正态分布的 3σ 法则
- 分布表示:正态分布 N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2)(图中标注对应分布形态 )
- 概率占比:
- μ±σ\mu \pm \sigmaμ±σ 区间概率约 68.2%
- μ±2σ\mu \pm 2\sigmaμ±2σ 区间概率约 95.4%
- μ±3σ\mu \pm 3\sigmaμ±3σ 区间概率约 99.7%
2. 不等式的含义
切比雪夫不等式公式的另一种形式:
P{∣X−EX∣<ε}≥1−DXε2P\{|X - EX| < \varepsilon\} \geq 1 - \frac{DX}{\varepsilon^2} P{∣X−EX∣<ε}≥1−ε2DX
(其中 ( X ) 是随机变量,( EX ) 为其期望,( DX ) 为方差,( \varepsilon ) 是任意正数 )
∣X−EX∣|X - EX|∣X−EX∣就是X到均值的距离
这个公式就是对∣X−EX∣<ε|X - EX| < \varepsilon∣X−EX∣<ε这件事的概率做估计
3. 不等式的意义
-
当 ε\varepsilonε = σ\sigmaσ 时:
P{∣X−EX∣<σ}≥1−σ2σ2=0P\{|X - EX| < \sigma\} \geq 1 - \frac{\sigma^2}{\sigma^2} = 0 P{∣X−EX∣<σ}≥1−σ2σ2=0 -
当 ε\varepsilonε = 2σ2\sigma2σ 时:
P{∣X−EX∣<2σ}≥1−σ2(2σ)2=1−14=34=75%P\{|X - EX| < 2\sigma\} \geq 1 - \frac{\sigma^2}{(2\sigma)^2} = 1 - \frac{1}{4} = \frac{3}{4} = 75\% P{∣X−EX∣<2σ}≥1−(2σ)2σ2=1−41=43=75%
由此可见切比雪夫的估计比较保守
假如随便画一个分布,求阴影部分概率,切比雪夫不等式告诉我们这个概率一定大于等于75%,这就是其高明之处
二、不等式的证明
1. 马尔科夫不等式
- 公式:P{Y≥a}≤EYaP\{ Y \geq a \} \leq \frac{EY}{a}P{Y≥a}≤aEY (YYY 取非负 )
马尔可夫不等式证明(YYY 为非负随机变量 )
-
由期望定义,YYY 的数学期望:
EY=∫0+∞y⋅f(y)dyEY = \int_{0}^{+\infty} y \cdot f(y) \, dyEY=∫0+∞y⋅f(y)dy -
因Y≥0Y \geq 0Y≥0,且积分区间可拆分,当y≥ay \geq ay≥a 时y≥ay \geq ay≥a,故:
EY≥∫a+∞y⋅f(y)dy≥∫a+∞a⋅f(y)dyEY \geq \int_{a}^{+\infty} y \cdot f(y) \, dy \geq \int_{a}^{+\infty} a \cdot f(y) \, dyEY≥∫a+∞y⋅f(y)dy≥∫a+∞a⋅f(y)dy -
化简右侧积分:
∫a+∞a⋅f(y)dy=a⋅∫a+∞f(y)dy=a⋅P{Y≥a}\int_{a}^{+\infty} a \cdot f(y) \, dy = a \cdot \int_{a}^{+\infty} f(y) \, dy = a \cdot P\{ Y \geq a \}∫a+∞a⋅f(y)dy=a⋅∫a+∞f(y)dy=a⋅P{Y≥a} -
综上,整理得:
P{Y≥a}≤EYaP\{ Y \geq a \} \leq \frac{EY}{a}P{Y≥a}≤aEY
2. 切比雪夫不等式推导
-
基础:马尔可夫不等式
P{Y≥a}≤EYaP\{ Y \geq a \} \leq \frac{EY}{a}P{Y≥a}≤aEY
(其中 ( Y ) 为非负随机变量 ) -
变量代换:
令 Y=(X−EX)2Y = (X - EX)^2Y=(X−EX)2,a=ε2a = \varepsilon^2a=ε2 -
代入推导:
- 第一步推导:
P{(X−EX)2≥ε2}≤E[(X−EX)2]ε2P\{ (X - EX)^2 \geq \varepsilon^2 \} \leq \frac{E\left[(X - EX)^2\right]}{\varepsilon^2}P{(X−EX)2≥ε2}≤ε2E[(X−EX)2] - 因 E[(X−EX)2]=DXE\left[(X - EX)^2\right] = DXE[(X−EX)2]=DX(方差定义 ),且 (X−EX)2≥ε2⇔∣X−EX∣≥ε(X - EX)^2 \geq \varepsilon^2 \Leftrightarrow |X - EX| \geq \varepsilon(X−EX)2≥ε2⇔∣X−EX∣≥ε ,进一步得:
P{∣X−EX∣≥ε}≤DXε2P\{ |X - EX| \geq \varepsilon \} \leq \frac{DX}{\varepsilon^2}P{∣X−EX∣≥ε}≤ε2DX
- 第一步推导: