概率质量/密度函数、累计分布函数详解
1 随机变量是什么
随机变量XXX:本质是一个函数,把“试验结果”映射为数值。
但光有XXX还不够,我们要知道 它的取值有多大概率出现。
于是引入 分布函数 来描述随机变量的规律。
2 概率质量函数(Probability Mass Function, PMF)
定义
适用于离散随机变量:pX(x)=P(X=x)p_X(x)=\mathbb{P}(X=x)pX(x)=P(X=x)
表示随机变量 XXX 取值为 xxx 的概率。
名字由来
Mass(质量):概率在某些点上集中,就像一堆沙子放在离散的点上。
每个点都有一个“概率质量”,所有点的质量加起来 = 1。
性质
非负:pX(x)≥0p_X(x)\ge 0pX(x)≥0
归一化:∑xpX(x)=1\sum_{x} p_X(x)=1∑xpX(x)=1
作用
完全描述一个离散随机变量的分布
计算概率:P(X∈A)=∑x∈ApX(x)\mathbb{P}(X\in A)=\sum_{x\in A}p_X(x)P(X∈A)=∑x∈ApX(x)
计算期望:E[X]=∑xx,pX(x)\mathbb{E}[X]=\sum_x x,p_X(x)E[X]=∑xx,pX(x)
3.概率密度函数(Probability Density Function,PDF)
定义
适用于连续随机变量:
P(a≤X≤b)=∫abfX(x)dx\mathbb{P}(a \leq X \leq b) = \int_a^b f_X(x)dxP(a≤X≤b)=∫abfX(x)dx
名字由来
Density(密度):概率像“涂抹在一条线上”,不是集中在某点。
f(x)f(x)f(x) 不是概率,而是概率密度,积分才是概率。(物理上m=ρvm=\rho vm=ρv)
性质
非负:fX(x)≥0f_X(x)\ge 0fX(x)≥0
归一化:∫−∞∞fX(x),dx=1\int_{-\infty}^{\infty} f_X(x),dx = 1∫−∞∞fX(x),dx=1
作用
完全描述一个连续随机变量的分布
区间概率:P(a≤X≤b)=∫abf(x),dx\mathbb{P}(a\le X\le b)=\int_a^b f(x),dxP(a≤X≤b)=∫abf(x),dx
期望:E[X]=∫−∞∞xf(x),dx\mathbb{E}[X]=\int_{-\infty}^{\infty} x f(x),dxE[X]=∫−∞∞xf(x),dx
4.累积分布函数(Cumulative Distribution Function,CDF)
定义
适用于所有随机变量(离散/连续/混合):
FX(x)=(X≤x)F_X(x)=\mathbb(X \leq x)FX(x)=(X≤x)
名字由来
Cumulative(累积):从 −∞-\infty−∞ 到 xxx,把所有概率加起来。
离散时是台阶函数;连续时是平滑曲线。
性质
单调不减
边界条件:limx→−∞F(x)=0,limx→∞F(x)=1\lim_{x\to -\infty}F(x)=0,lim_{x\to\infty}F(x)=1limx→−∞F(x)=0,limx→∞F(x)=1
离散:跳跃高度 = PMF
连续:导数 = PDF
作用
统一描述所有分布
概率计算:P(a<X≤b)=F(b)−F(a)\mathbb{P}(a<X\le b)=F(b)-F(a)P(a<X≤b)=F(b)−F(a)
采样:逆变换法,U∼Uniform(0,1)U\sim \text{Uniform}(0,1)U∼Uniform(0,1),取 X=F−1(U)X=F^{-1}(U)X=F−1(U)
5.三者关系总结
PMF:点上的概率大小(只适合离散)
PDF:点上的概率密度(积分才是概率,适合连续)
CDF:累计概率,适合所有随机变量
离散:p(x)=P(X=x),F(x)=∑t≤xp(t)p(x)=\mathbb{P}(X=x),F(x)=\sum_{t \le x}p(t)p(x)=P(X=x),F(x)=∑t≤xp(t)
连续:f(x)=ddxF(x),F(x)=∫−∞xf(t)dtf(x)=\frac{d}{dx}F(x),F(x)=\int_{-\infty}^xf(t)dtf(x)=dxdF(x),F(x)=∫−∞xf(t)dt