“相关分析”
一、相关分析的核心概念
1.定义
(1)衡量两个或多个变量之间的线性或单调关系的强度和方向(正/负相关)。
(2)注意:相关性 ≠ 因果关系。
2.相关系数的范围
(1)取值范围为 [-1, 1]:
1:完全正相关
-1:完全负相关
0:无线性相关
3.应用场景
(1)探索变量间的潜在关系(如收入与消费水平、广告投入与销售额)。
(2)辅助特征选择(如剔除高度相关的变量,避免多重共线性)。
二、常用相关系数及方法
1.Pearson相关系数
(1)定义:衡量两个连续变量的线性相关程度。
(2)公式:
(3)适用条件:
变量为连续型数据。
数据服从正态分布(可通过直方图或Q-Q图检验&#x