统计学(第8版)——假设检验学习笔记(考试用)
一、假设检验核心框架
(一)解决的核心问题
- 判断样本与总体 / 样本与样本的差异是由抽样误差还是本质差异引起
- 典型场景:
- 产品合格率是否达标(比例检验)
- 工艺改进后均值是否显著变化(均值检验)
- 两生产线方差是否一致(方差检验)
(二)与参数估计的本质区别
对比维度 | 参数估计 | 假设检验 |
目标 | 用样本估计总体参数范围 | 检验关于总体参数的假设 |
逻辑起点 | 未知参数需估计 | 先对参数提出假设 |
输出形式 | 置信区间 | 拒绝 / 不拒绝原假设 |
二、假设检验基本原理(核心逻辑)
(一)小概率反证法三步曲
- 假设成立:先假定原假设 H₀为真
- 推导矛盾:计算在 H₀成立的条件下,样本数据出现的概率
- 决策规则:
- 若概率≤α(小概率事件):拒绝 H₀(反证法证明 H₀不成立)
- 若概率 >α:不拒绝 H₀(证据不足,无法推翻 H₀)
(二)两类错误的数学定义
错误类型 | 符号 | 定义 | 概率控制 | 典型场景 |
第一类错误 | α | H₀为真时拒绝 H₀(弃真) | 主动设定 α=0.05/0.01 | 医疗误诊(α 需严格控制) |
第二类错误 | β | H₀为假时接受 H₀(取伪) | 通过增大 n 降低 β | 质量检验漏检(β 需控制) |
(三)α 与 β 的关系公式
- 数学关系:固定 n 时,α↓→β↑,α↑→β↓(翘翘板效应)
- 突破方法:增大样本量 n 可同时减小 α 和 β
三、假设检验标准流程(含公式条件)
(一)六步执行法
- 提出假设:
- 双侧:H₀:μ=μ₀ vs H₁:μ≠μ₀
- 右侧:H₀:μ≤μ₀ vs H₁:μ>μ₀(如检验 “显著提高”)
- 左侧:H₀:μ≥μ₀ vs H₁:μ<μ₀(如检验 “显著降低”)
- 选择统计量:核心依据 4 要素
- 参数类型:均值 / 比例 / 方差
- 样本量:大样本 (n≥30)/ 小样本 (n<30)
- 总体分布:正态 / 非正态(非正态大样本可用正态近似)
- 方差已知性:σ 已知 /σ 未知
- 计算统计量值:代入样本数据计算
- 确定拒绝域:根据 α 和检验类型(双侧 / 单侧)查表
- 计算 p 值(可选):原假设为真时,出现当前或更极端结果的概率
- 决策:
- 临界值法:统计量落入拒绝域→拒绝 H₀
- p 值法:p<α→拒绝 H₀
(二)统计量公式及适用条件汇总表
四、核心知识点详解
(一)单总体均值检验(关键:区分大 / 小样本、方差已知性)
五、公式条件速查表(考试重点)
统计量 | 分布 | 必要条件 |
Z(均值) | N(0,1) | ① 正态 σ 已知;② 非正态 n≥30 |
t(均值) | t(df) | 正态 σ 未知且 n<30 |
Z(比例) | N(0,1) | np≥5 且 n (1-p)≥5 |
χ²(方差) | χ²(df) | 正态总体 |
F(方差比) | F(df1,df2) | 两正态总体 |
两类错误关系图
- 横轴:总体均值 μ
- 纵轴:检验统计量分布
- 左侧曲线:H₀为真时分布(μ=μ₀)
- 右侧曲线:H₁为真时分布(μ=μ₁<μ₀)
- α 区域:H₀为真时拒绝 H₀的面积(左侧尾部)
- β 区域:H₁为真时接受 H₀的面积(右侧非阴影区)