概率与数理统计公式及结论汇总
概率与数理统计公式及结论汇总
一、随机事件及其概率
-
基本等式
- (A \cup \Omega=\Omega)
- (A \cap \Omega=A)
-
吸收律
- (A \cup \emptyset=A)
- (A \cap \emptyset=\emptyset)
- (A \cup(AB)=A)
- (A \cap(A \cup B)=A)
-
差事件公式
- (A - B=A \overline{B}=A-(AB))
-
反演律(德摩根定律)
- (\overline{A \cup B}=\overline{A} \overline{B})
- (\overline{AB}=\overline{A} \cup \overline{B})
- (\overline{\bigcup_{i=1}^{n} A_{i}}=\bigcap_{i=1}^{n} \overline{A_{i}})
- (\overline{\bigcap_{i=1}^{n} A_{i}}=\bigcup_{i=1}^{n} \overline{A_{i}})
二、概率的定义及其计算
-
对立事件概率
- (P(\overline{A})=1 - P(A))
-
子集概率关系
- 若(A \subset B),则(P(B)\geq P(A))(文档中"(RB) 令 (P(B) - P(A))"应为笔误,正确关系为概率的单调性)
-
加法公式
- 对任意两个事件(A)、(B),有(P(A \cup B)=P(A)+P(B)-P(AB))
- 推论:(P(A \cup B) \leq P(A)+P(B))
- 一般形式(多事件加法公式):
[P\left(\bigcup_{i=1}^{n} A_{i}\right)=\sum_{i=1}^{n} P\left(A_{i}\right)-\sum_{1 \leq i<j \leq n} P\left(A_{i}A_{j}\right)+\sum_{1 \leq i<j<k \leq n} P\left(A_{i}A_{j}A_{k}\right)+\cdots+(-1)^{n-1} P\left(A_{1}A_{2} \cdots A_{n}\right)]
三、条件概率相关公式
-
条件概率定义
- (P(B | A)=\frac{P(AB)}{P(A)})(其中(P(A)>0))
-
乘法公式
- 两事件:(P(AB)=P(A)P(B | A))((P(A)>0))
- 多事件:(P\left(A_{1}A_{2} \cdots A_{n}\right)=P\left(A_{1}\right)P\left(A_{2} | A_{1}\right) \cdots P\left(A_{n} | A_{1}A_{2} \cdots A_{n-1}\right))((P\left(A_{1}A_{2} \cdots A_{n-1}\right)>0))
-
全概率公式
- 若(B_{1}, B_{2}, \cdots, B_{n})是样本空间(\Omega)的一个划分(互斥且穷尽),则对任意事件(A),有(P(A)=\sum_{i=1}^{n} P\left(AB_{i}\right)=\sum_{i=1}^{n} P\left(B_{i}\right) \cdot P\left(A | B_{i}\right))
-
贝叶斯(Bayes)公式
- 若(B_{1}, B_{2}, \cdots, B_{n})是样本空间(\Omega)的一个划分,且(P(A)>0),(P(B_{i})>0)((i = 1,2,\cdots,n)),则(P\left(B_{k} | A\right)=\frac{P\left(AB_{k}\right)}{P(A)}=\frac{P\left(B_{k}\right)P\left(A | B_{k}\right)}{\sum_{i=1}^{n} P\left(B_{i}\right)P\left(A | B_{i}\right)})((k = 1,2,\cdots,n))
四、随机变量及其分布
- 分布函数性质与计算
- 分布函数定义:(F(x)=P(X \leq x))((-\infty < x < +\infty))
- 概率计算:(P(a < X \leq b)=P(X \leq b)-P(X \leq a)=F(b)-F(a))
五、离散型随机变量
-
0-1分布
- 概率分布:(P(X = k)=p{k}(1-p){1-k}),其中(k = 0,1),(0 < p < 1)((p)为事件成功概率)
-
二项分布(B(n, p))
- 背景:(n)次独立重复试验,每次试验成功概率为(p),(X)表示成功次数
- 概率分布:(P(X = k)=C_{n}{k}p{k}(1-p)^{n-k}),其中(k = 0,1,\cdots,n),(0 < p < 1)
-
泊松(Poisson)定理与泊松分布
- 泊松定理:若(\lim_{n \to \infty} np_{n}=\lambda>0),则对任意非负整数(k),有(\lim_{n \to \infty} C_{n}{k}p_{n}{k}(1-p_{n}){n-k}=e{-\lambda}\frac{\lambda^{k}}{k!})
- 泊松分布概率:(P(X = k)=e{-\lambda}\frac{\lambda{k}}{k!}),其中(k = 0,1,2,\cdots),(\lambda>0)(常用于近似二项分布,当(n)大、(p)小时)
六、连续型随机变量
-
均匀分布(U(a, b))
- 概率密度函数:(f(x)=\begin{cases}\frac{1}{b-a}, & a < x < b \ 0, & \text{其他}\end{cases})
- 分布函数:(F(x)=\begin{cases}0, & x < a \ \frac{x-a}{b-a}, & a \leq x < b \ 1, & b \leq x\end{cases})
-
指数分布(E(\lambda))
- 概率密度函数:(f(x)=\begin{cases}\lambda e^{-\lambda x}, & x > 0 \ 0, & \text{其他}\end{cases})((\lambda>0),为速率参数)
- 分布函数:(F(x)=\begin{cases}0, & x < 0 \ 1 - e^{-\lambda x}, & x \geq 0\end{cases})((\lambda>0))
-
正态分布(N(\mu, \sigma^{2}))
- 概率密度函数:(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e{-\frac{(x-\mu){2}}{2\sigma^{2}}})((-\infty < x < +\infty),(\mu)为均值,(\sigma>0)为标准差)
- 分布函数:(F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}{x}e{-\frac{(t-\mu){2}}{2\sigma{2}}}dt)((-\infty < x < +\infty))
-
标准正态分布(N(0,1))(正态分布的特殊情况,(\mu = 0),(\sigma = 1))
- 概率密度函数:(\varphi(x)=\frac{1}{\sqrt{2\pi}}e{-\frac{x{2}}{2}})((-\infty < x < +\infty))
- 分布函数:(\Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}{x}e{-\frac{t^{2}}{2}}dt)((-\infty < x < +\infty)),且满足(\Phi(-x)=1 - \Phi(x))
七、多维随机变量及其分布(以二维为例)
-
二维随机变量((X, Y))的分布函数(联合分布函数)
- (F(x,y)=\int_{-\infty}{x}\int_{-\infty}{y}f(u,v)dvdu)((-\infty < x, y < +\infty),(f(u,v))为联合概率密度函数)
-
边缘分布函数与边缘密度函数
- (X)的边缘分布函数:(F_{X}(x)=\int_{-\infty}{x}\int_{-\infty}{+\infty}f(u,v)dvdu)(即(F(x, +\infty)))
- (X)的边缘概率密度函数:(f_{X}(x)=\int_{-\infty}^{+\infty}f(x,v)dv)
- (Y)的边缘分布函数:(F_{Y}(y)=\int_{-\infty}{y}\int_{-\infty}{+\infty}f(u,v)dudv)(即(F(+\infty, y)))
- (Y)的边缘概率密度函数:(f_{Y}(y)=\int_{-\infty}^{+\infty}f(u,y)du)
八、常见连续型二维随机变量
-
区域(G)上的均匀分布(U(G))
- 联合概率密度函数:(f(x,y)=\begin{cases}\frac{1}{A}, & (x,y) \in G \ 0, & \text{其他}\end{cases})((A)为区域(G)的面积)
-
二维正态分布
- 联合概率密度函数:
[f(x,y)=\frac{1}{2\pi\sigma_{1}\sigma_{2}\sqrt{1-\rho{2}}}e{-\frac{1}{2(1-\rho{2})}\left[\frac{(x-\mu_{1}){2}}{\sigma_{1}{2}}-2\rho\frac{(x-\mu_{1})(y-\mu_{2})}{\sigma_{1}\sigma_{2}}+\frac{(y-\mu_{2}){2}}{\sigma_{2}^{2}}\right]}]
其中(\mu_{1},\mu_{2})为均值,(\sigma_{1}>0,\sigma_{2}>0)为标准差,(\rho)为相关系数((|\rho| \leq 1))
- 联合概率密度函数:
九、二维随机变量的条件分布
-
条件概率密度函数关系
- 联合密度与条件密度:(f(x,y)=f_{X}(x)f_{Y|X}(y|x))((f_{X}(x)>0));(f(x,y)=f_{Y}(y)f_{X|Y}(x|y))((f_{Y}(y)>0))
- 边缘密度与条件密度:(f_{X}(x)=\int_{-\infty}{+\infty}f(x,y)dy=\int_{-\infty}{+\infty}f_{X|Y}(x|y)f_{Y}(y)dy);(f_{Y}(y)=\int_{-\infty}{+\infty}f(x,y)dx=\int_{-\infty}{+\infty}f_{Y|X}(y|x)f_{X}(x)dx)
-
条件概率密度公式
- (f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}=\frac{f_{Y|X}(y|x)f_{X}(x)}{f_{Y}(y)})((f_{Y}(y)>0))
- (f_{Y|X}(y|x)=\frac{f(x,y)}{f_{X}(x)}=\frac{f_{X|Y}(x|y)f_{Y}(y)}{f_{X}(x)})((f_{X}(x)>0))
十、随机变量的数字特征
-
数学期望(均值)
- 离散型随机变量:(E(X)=\sum_{k=1}^{+\infty}x_{k}p_{k})((x_{k})为取值,(p_{k}=P(X = x_{k})),要求级数绝对收敛)
- 连续型随机变量:(E(X)=\int_{-\infty}^{+\infty}xf(x)dx)((f(x))为概率密度,要求积分绝对收敛)
-
常用矩(数字特征的基础)
- (X)的(k)阶原点矩:(E(X^{k}))
- (X)的(k)阶绝对原点矩:(E(|X|^{k}))
- (X)的(k)阶中心矩:(E((X-E(X))^{k}))
- (X)与(Y)的(k+l)阶混合原点矩:(E(X{k}Y{l}))
- (X)与(Y)的(k+l)阶混合中心矩:(E((X-E(X)){k}(Y-E(Y)){l}))
- (X)与(Y)的二阶混合原点矩:(E(XY))
- (X)与(Y)的二阶混合中心矩:协方差(\text{cov}(X,Y)=E((X-E(X))(Y-E(Y))))
-
方差(二阶中心矩,衡量离散程度)
- 定义式:(D(X)=E\left[(X-E(X))^{2}\right])
- 计算式:(D(X)=E(X{2})-[E(X)]{2})(更易计算,需先求(E(X))和(E(X^{2})))
-
协方差(衡量两变量线性相关程度)
- 定义式:(\text{cov}(X,Y)=E((X-E(X))(Y-E(Y))))
- 计算式1:(\text{cov}(X,Y)=E(XY)-E(X)E(Y))
- 计算式2:(\text{cov}(X,Y)=\frac{1}{2}[D(X+Y)-D(X)-D(Y)])
-
相关系数(标准化的协方差,消除量纲影响)
- 定义式:(\rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}})(其中(D(X)>0),(D(Y)>0))
- 性质:(|\rho_{XY}| \leq 1);(|\rho_{XY}| = 1)的充要条件是存在常数(a, b)((a \neq 0)),使得(P(Y = aX + b)=1)(即两变量线性相关)