确定聚类的最终分组

聚类的最终分组(也称为最终分割)是指将按观测值或变量是否具有共同特征来确定组别的聚类分组。有关最终分组的决定又称为切割树状图。完整的树状图(树形图)是将观测值或变量合并为一个聚类的过程的图形化描述。切割树状图类似于在树状图中画线指定最终分组。下面的步骤可帮助您确定在何处剪切树状图。

  1. 使用默认设置(最终分区中 1 个聚类)执行聚类分析。Minitab 会显示所有可能聚类数的结果。
  2. 在表格输出中和树状图中检查相似性和距离水平。 通过将鼠标指针放在树状图中的水平线上,可以查看相似性水平。任何步阶的相似性水平都是该步阶的最小距离相对于数据中观测值间最大距离的百分比。
  3. 选择您想从哪里进行最终分割。 相似性或距离值随步骤变化的模式可以帮助您选择最终分组。值发生急剧变化的步骤可能是切割树状图的合适点,前提是这对您的数据合乎逻辑。
  4. 使用点群数相似性水平再次执行聚类过程可为您提供切割树状图的固定组数或相似性水平。
  5. 检查最终分割中得到的聚类,以确定分组是否合乎逻辑。 通过检查不同最终分组的树状图,还可以帮助您决定对数据最合乎逻辑的分组。
注意

对于一些数据集,平均法、质心法、中位数法和 Ward 法可能不会生成分层树状图。也就是说,合并距离并非总在每个步骤增加。在树状图中,这种步骤产生的合并将会向下而不是向上。