统计学(第8版)——统计学基础统计抽样与抽样分布(考试用)
一、抽样基本概念(符号要点)
(一)核心参数与统计量符号对比
类型 | 概念 | 符号 | 说明 |
---|---|---|---|
参数 | 总体均值 | μ \mu μ | 唯一确定的总体特征值,通常未知 |
参数 | 总体方差 | σ 2 \sigma^2 σ2 | 反映总体数据离散程度 |
参数 | 总体标准差 | σ \sigma σ | σ = σ 2 \sigma = \sqrt{\sigma^2} σ=σ2 |
统计量 | 样本均值 | x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i xˉ=n1∑i=1nxi | 样本数据的算术平均,随机变量 |
统计量 | 样本方差 | s 2 = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2 s2=n−11∑i=1n(xi−xˉ)2 | 无偏估计总体方差,随机变量 |
统计量 | 样本标准差 | s = s 2 s = \sqrt{s^2} s=s2 | 与样本方差对应,量纲一致 |
二、重要概率分布(符号完整定义)
(一)正态分布( N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2))
1. 概率密度函数
f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 ( − ∞ < x < + ∞ ) f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}} \quad (-\infty < x < +\infty) f(x)=σ2π1e−2σ2(x−μ)2(−∞<x<+∞)
-
符号说明:
-
μ \mu μ:均值,决定分布中心位置
-
σ \sigma σ:标准差( σ > 0 \sigma > 0 σ>0),决定分布离散程度
-
2. 标准化转换公式
若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),令标准化变量:
Z = X − μ σ ∼ N ( 0 , 1 ) Z = \frac{X - \mu}{\sigma} \sim N(0, 1) Z=σX−μ∼N(0,1)
例题:设 X ∼ N ( 1 , 4 ) X \sim N(1, 4) X∼N(1,4),求 P ( 0 < X ≤ 10 ) P(0 < X \leq 10) P(0<X≤10)
解:
-
标准化: Z 1 = 0 − 1 2 = − 0.5 Z_1 = \frac{0-1}{2} = -0.5 Z1=20−1=−0.5, Z 2 = 10 − 1 2 = 4.5 Z_2 = \frac{10-1}{2} = 4.5 Z2=210−1=4.5
-
查标准正态表: Φ ( 4.5 ) ≈ 1 \Phi(4.5) \approx 1 Φ(4.5)≈1, Φ ( − 0.5 ) = 1 − Φ ( 0.5 ) = 1 − 0.6915 = 0.3085 \Phi(-0.5) = 1 - \Phi(0.5) = 1 - 0.6915 = 0.3085 Φ(−0.5)=1−Φ(0.5)=1−0.6915=0.3085
-
概率: P ( 0 < X ≤ 10 ) = Φ ( 4.5 ) − Φ ( − 0.5 ) ≈ 1 − 0.3085 = 0.6915 P(0 < X \leq 10) = \Phi(4.5) - \Phi(-0.5) \approx 1 - 0.3085 = 0.6915 P(0<X≤10)=Φ(4.5)−Φ(−0.5)≈1−0.3085=0.6915
(二)卡方分布( χ 2 \chi^2 χ2分布)
1. 定义式
若 X 1 , X 2 , … , X n ∼ N ( 0 , 1 ) X_1, X_2, \dots, X_n \sim N(0, 1) X1,X2,…,Xn∼N(0,1)且独立,则:
χ 2 = ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \chi^2 = \sum_{i=1}^{n}X_i^2 \sim \chi^2(n) χ2=∑i=1nXi2∼χ2(n)
-
符号说明:
-
χ 2 \chi^2 χ2:卡方统计量,希腊字母 χ \chi χ(读作 “卡”)
-
n n n:自由度,决定分布形态(右偏)
-
2. 单正态总体应用
若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),样本容量为 n n n,样本方差为 s 2 s^2 s2,则:
( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)s2∼χ2(n−1)
(三)F 分布( F ( n 1 , n 2 ) F(n_1, n_2) F(n1,n2))
1. 定义式
若 V ∼ χ 2 ( n 1 ) V \sim \chi^2(n_1) V∼χ2(n1), W ∼ χ 2 ( n 2 ) W \sim \chi^2(n_2) W∼χ2(n2)且独立,则:
F = V / n 1 W / n 2 ∼ F ( n 1 , n 2 ) F = \frac{V/n_1}{W/n_2} \sim F(n_1, n_2) F=W/n2V/n1∼F(n1,n2)
-
符号说明:
-
n 1 n_1 n1:第一自由度(分子自由度)
-
n 2 n_2 n2:第二自由度(分母自由度)
-
2. 双正态总体应用
设两组独立样本:
-
X 1 , … , X n 1 ∼ N ( μ 1 , σ 1 2 ) X_1, \dots, X_{n_1} \sim N(\mu_1, \sigma_1^2) X1,…,Xn1∼N(μ1,σ12),样本方差 s 1 2 s_1^2 s12
-
Y 1 , … , Y n 2 ∼ N ( μ 2 , σ 2 2 ) Y_1, \dots, Y_{n_2} \sim N(\mu_2, \sigma_2^2) Y1,…,Yn2∼N(μ2,σ22),样本方差 s 2 2 s_2^2 s22
若 σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22,则:
s 1 2 s 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \frac{s_1^2}{s_2^2} \sim F(n_1-1, n_2-1) s22s12∼F(n1−1,n2−1)
(四)t 分布( t ( n ) t(n) t(n))
1. 定义式
若 U ∼ N ( 0 , 1 ) U \sim N(0, 1) U∼N(0,1), W ∼ χ 2 ( n ) W \sim \chi^2(n) W∼χ2(n)且独立,则:
t = U W / n ∼ t ( n ) t = \frac{U}{\sqrt{W/n}} \sim t(n) t=W/nU∼t(n)
-
符号说明:
-
t t t:t 统计量,又称 “学生 t 统计量”
-
n n n:自由度,当 n → ∞ n \to \infty n→∞时, t ( n ) → N ( 0 , 1 ) t(n) \to N(0, 1) t(n)→N(0,1)
-
2. 单正态总体应用
若 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),样本容量为 n n n,则:
t = x ˉ − μ s / n ∼ t ( n − 1 ) t = \frac{\bar{x} - \mu}{s/\sqrt{n}} \sim t(n-1) t=s/nxˉ−μ∼t(n−1)
例题:面包日销量 μ = 70 \mu = 70 μ=70,样本 n = 15 n=15 n=15, s 2 = 16 s^2=16 s2=16,求 x ˉ = 74 \bar{x}=74 xˉ=74的概率
解:
-
计算 t t t值: t = 74 − 70 4 / 15 = 4 4 / 3.872 ≈ 3.873 t = \frac{74-70}{4/\sqrt{15}} = \frac{4}{4/3.872} \approx 3.873 t=4/1574−70=4/3.8724≈3.873
-
查 t t t分布表(自由度 14 14 14): P ( t ≥ 3.873 ) P(t \geq 3.873) P(t≥3.873)介于 0.0005 ∼ 0.001 0.0005 \sim 0.001 0.0005∼0.001之间
三、样本均值的抽样分布(符号公式)
(一)无限总体
若总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X∼N(μ,σ2),样本均值 x ˉ \bar{x} xˉ满足:
-
期望: E ( x ˉ ) = μ E(\bar{x}) = \mu E(xˉ)=μ
-
方差: D ( x ˉ ) = σ 2 n D(\bar{x}) = \frac{\sigma^2}{n} D(xˉ)=nσ2,标准差 σ x ˉ = σ n \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} σxˉ=nσ(均值标准差)
(二)有限总体(无放回抽样)
当 n / N > 0.1 n/N > 0.1 n/N>0.1( N N N为总体容量),需引入有限总体修正系数:
D ( x ˉ ) = σ 2 n ⋅ N − n N − 1 D(\bar{x}) = \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1} D(xˉ)=nσ2⋅N−1N−n
- 符号说明: N − n N − 1 \frac{N-n}{N-1} N−1N−n用于修正无放回抽样的样本独立性损失
四、大数定律与中心极限定理(符号表述)
(一)辛钦大数定律
若 X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X1,X2,…,Xn独立同分布, E ( X i ) = μ E(X_i) = \mu E(Xi)=μ,则:
x ˉ = 1 n ∑ i = 1 n X i → P μ ( n → ∞ ) \bar{x} = \frac{1}{n}\sum_{i=1}^{n}X_i \xrightarrow{P} \mu \quad (n \to \infty) xˉ=n1∑i=1nXiPμ(n→∞)
- 符号说明: → P \xrightarrow{P} P表示依概率收敛
(二)林德伯格 - 莱维中心极限定理
若 X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X1,X2,…,Xn独立同分布, E ( X i ) = μ E(X_i) = \mu E(Xi)=μ, D ( X i ) = σ 2 D(X_i) = \sigma^2 D(Xi)=σ2,则当 n n n足够大时:
x ˉ ∼ N ( μ , σ 2 n ) 或 x ˉ − μ σ / n ∼ N ( 0 , 1 ) \bar{x} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \quad \text{或} \quad \frac{\bar{x} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1) xˉ∼N(μ,nσ2)或σ/nxˉ−μ∼N(0,1)
- 应用条件: n ≥ 30 n \geq 30 n≥30(大样本)
五、核心符号速查表
符号 | 含义 | 所属领域 |
---|---|---|
μ \mu μ | 总体均值 | 参数 |
σ \sigma σ | 总体标准差 | 参数 |
x ˉ \bar{x} xˉ | 样本均值 | 统计量 |
s s s | 样本标准差 | 统计量 |
χ 2 \chi^2 χ2 | 卡方统计量 | 抽样分布 |
F F F | F 统计量 | 抽样分布 |
t t t | t 统计量 | 抽样分布 |
∑ \sum ∑ | 求和符号(如 ∑ i = 1 n x i \sum_{i=1}^{n}x_i ∑i=1nxi表示样本观测值之和) | 基础运算 |
Φ ( x ) \Phi(x) Φ(x) | 标准正态分布的累积分布函数( P ( Z ≤ x ) P(Z \leq x) P(Z≤x)) | 概率计算 |