比较连续型自变量和从连续型变量转换成了三分类变量的因变量的关系
当 因变量为连续型变量,自变量为连续型变量转换的三分类变量(如低、中、高组),且正态性检验(Shapiro-Wilk)结果显示 部分组别不满足正态性(如低表达组P>0.05,中、高表达组P<0.05)时,需根据数据特征选择检验方法。以下是具体分析策略和操作建议:
1. 核心分析目标
比较 三分类自变量(如FAM49B低/中/高组) 对 连续因变量(如炎症评分、生存时间等) 的影响。
2. 检验方法选择依据
(1) 正态性与方差齐性判断
-
正态性:
- 低表达组(P>0.05):正态
- 中、高表达组(P<0.05):非正态
→ 部分组别非正态,需优先考虑非参数检验或稳健方法。
-
方差齐性:
需通过 Levene检验 验证三组方差是否齐性(SPSS操作:Analyze → Compare Means → One-Way ANOVA → Options → Homogeneity of variance test
)。- 若 P>0.05:方差齐
- 若 P<0.05:方差不齐
(2) 方法选择流程图
3. 推荐检验方法及操作
(1) 首选方法:Kruskal-Wallis检验(非参数)
-
适用条件:
- 任意一组不满足正态性(如本例中、高表达组)
- 无论方差齐性与否均可使用
-
SPSS操作:
Analyze → Nonparametric Tests → Independent Samples → Kruskal-Wallis
- 将因变量拖入 Test Variables,三分类自变量拖入 Grouping Variable。
- 勾选 Descriptive statistics 查看中位数和四分位数。
-
结果解读:
- 若 P<0.05,说明三组间至少存在一组差异显著。
- 需进一步进行 Dunn-Bonferroni两两比较(SPSS需手动计算或使用语法)。
(2) 替代方法:Welch’s ANOVA(稳健参数检验)
-
适用条件:
- 正态性部分满足(如本例低表达组正态)
- 方差不齐(Levene检验P<0.05)
-
SPSS操作:
Analyze → Compare Means → One-Way ANOVA
- 将因变量拖入 Dependent List,三分类自变量拖入 Factor。
- 点击 Options,勾选 Welch 和 Descriptives。
-
结果解读:
- 关注 Welch’s F 和 P值。
- 若显著,用 Games-Howell检验 进行两两比较(无需方差齐性)。
4. 两两比较方法选择
主检验 | 两两比较方法 | 适用条件 |
---|---|---|
Kruskal-Wallis | Dunn-Bonferroni | 非正态数据,控制族系误差 |
Welch’s ANOVA | Games-Howell | 方差不齐,无需校正方差 |
5. 示例分析(以FAM49B三分类为例)
假设场景:
- 因变量:炎症评分(连续)
- 自变量:FAM49B三分类(低:<50; 中:50-100; 高:>100)
SPSS操作步骤:
-
正态性检验:
- 对三组炎症评分分别进行Shapiro-Wilk检验。
- 结果:低组P=0.12(正态),中组P=0.03(非正态),高组P=0.01(非正态)。
-
方差齐性检验:
- Levene检验P=0.008(方差不齐)。
-
选择主检验:
- 因非正态且方差不齐 → Kruskal-Wallis检验。
-
两两比较:
- 若Kruskal-Wallis P=0.004,通过Dunn-Bonferroni校正比较:
- 低 vs 中:P=0.03 → 校正后P=0.09(不显著)
- 低 vs 高:P=0.002 → 校正后P=0.006(显著)
- 中 vs 高:P=0.04 → 校正后P=0.12(不显著)
- 若Kruskal-Wallis P=0.004,通过Dunn-Bonferroni校正比较:
6. 结果报告模板
**统计方法**:
因变量(炎症评分)在中、高FAM49B组中不满足正态性(Shapiro-Wilk P<0.05),故采用Kruskal-Wallis非参数检验。三组间总体差异显著(χ²=11.2, P=0.004)。Dunn-Bonferroni校正两两比较显示,仅低与高表达组差异显著(校正后P=0.006)。 **效应量**:
Kendall's W=0.25,表明FAM49B解释25%的炎症评分变异。
7. 注意事项
-
样本量要求:
- Kruskal-Wallis检验要求每组样本量≥5,若样本过小需用精确检验(如Permutation Test)。
-
效应量补充:
- 报告 η²(eta-squared) 或 Kendall’s W 以量化组间差异程度。
-
数据转换尝试:
- 若希望使用参数检验,可尝试对数/平方根转换,但需重新检验正态性。
通过上述方法,即使部分组别不满足正态性,仍能可靠分析三分类自变量对连续因变量的影响。