SPSS系统发育分析中的聚类相关part
聚类分析本质上需要在特定坐标空间(某种变换坐标系下,比如说是PCA的PC空间)下计算距离矩阵,
距离的定义本身就是依据特定坐标变换(仿射变换)而定义的,
聚类分析的核心就是计算sample之间的距离。
此处已经提供了距离矩阵,所以直接
在“变量视图”中创建6个数值变量,分别命名为属1、属2、属3、属4、属5、属6
获取新坐标系:
然后就是系统聚类分析中可以选择选项:
比如说是质心法、ward法等;
(1)如果是中间距离,那均值度量有mean、median,我们可以选择中位数:
(2)如果使用重心法:
(3)如果使用ward法:
(4)如果是k-means
1个聚了4类,另外一个是2类,其实就是决策树中间的叶节点(或者说不同层次合并上的非根节点),其实还是能够看出来点层次的,需要不断调整
实际上这里有个超参数,就是指定聚类的数目是多少个,而且是非层次化的聚类,不适合于系统发生分析