一家体育用品公司的设计师想检验一款新型足球守门员手套。他让 20 名运动员穿戴新型手套,并收集运动员的性别、身高、体重和用手习惯信息。设计师想根据运动员的相似点来对其进行分组。

  1. 打开样本数据集,手套测试仪.MTW
  2. 选择统计 > 多变量 > 观测值聚类
  3. 变量或距离矩阵中,输入性别高度重量用手习惯
  4. 联结法中,选择最长距离。从距离度量中,选择Euclidean
  5. 选择标准化变量
  6. 选择显示树状图
  7. 单击确定

解释结果

该表格显示每步合并的聚类、聚类之间的距离和聚类的相似性。
  • 到步骤 15 为止,相似性水平以大约 3 或更少的增量下降。当聚类数从 4 变为 3 时,相似性在步骤 16 和 17 的减少量超过 20(从 62.0036 到 41.0474)。
  • 合并聚类之间的距离先减少约 0.6 或更少。当聚类数从 4 变为 3 时,距离在步骤 16 和 17 的增量超过 1(从 1.81904 到 2.82229)。

距离和相似性结果表明 4 个聚类对于最终分割是足够的。如果设计人员认为此分组具有直观意义,则这可能是个不错的选择。树状图以树形图的形式显示表格中的信息。

设计人员应重新运行分析,并在最终分割中指定 4 个聚类。当您指定最终分割时,Minitab 会显示附加的表格,描述最终分割中包含的每个聚类的特征。

标准化变量, Euclidean 距离, 最长距离法

合并步骤

步骤点群数相似性水平距离水平已合并的点群号新聚类号新聚类号中的观测值个数
11996.60050.162751316132
21895.46420.217151720172
31795.26480.226696962
41692.91780.339051718173
51590.52960.453391115112
61490.31240.463781219122
71388.24310.5628521422
81288.24310.562855852
91185.97440.6714661063
101083.06390.8108071373
11983.06390.810801312
12881.40390.8902721725
13779.81850.9661761165
14678.75341.0171641243
15566.21121.617602527
16462.00361.819041617
17341.04742.8222914110
18240.17182.8642127210
1910.00004.7873912120

最终分割

观测值个数类内平方和到质心的平均距离到质心的最大距离
聚类120761.913232.53613