解释K 均值聚类的主要结果

请完成以下步骤来解释 k 均值聚类分析。主要输出包括最终分割中聚类的观测值和变异性度量。

步骤 1:检查最终分组

基于您指定的初始分割,检查最终分组并查看最终分割中的聚类是否具有直观意义。检查每个聚类中的观测值个数是否符合您的分组目标。如果一个聚类包含过少或过多观测值,您可能要使用另一个初始分割重新运行分析。

方法

点群数3
标准化变量

最终分割

观测值个数类内平方和到质心的平均距离到质心的最大距离
         
聚类141.5930.5780.884
聚类288.7360.9641.656
聚类31012.9211.0931.463

聚类质心

变量聚类1聚类2聚类3总质心
         
客户1.23180.5225-0.91080.0000
回报率1.29420.2217-0.69500.0000
销售量1.18660.5157-0.88720.0000
年数1.20300.5479-0.91950.0000

聚类质心之间的距离

聚类1聚类2聚类3
       
聚类10.00001.59154.1658
聚类21.59150.00002.6488
聚类34.16582.64880.0000
主要结果:最终分割

在这些结果中,Minitab 根据指定的初始分割将 22 家公司的数据聚类到 3 个聚类。聚类 1 包含 4 个观测值,代表更大的成熟公司。聚类 2 包含 8 个观测值,代表中等成长型公司。聚类 3 包含 10 个观测值,代表新公司。商业分析师认为这些最终分组对于数据是足够的。

注意

要查看每个观测值所属的聚类,必须在执行分析时输入存储列。Minitab 将各个观测值的聚类成员存储在工作表的列中。

步骤 2:评估每个聚类内的变异性

使用到质心的距离度量检查每个聚类内观测值的变异性。具有较高值的聚类表明聚类内观测值的变异性较高。如果聚类之间的变异性差别过大,则可能要使用另一个初始分割重新运行分析。

方法

点群数3
标准化变量

最终分割

观测值个数类内平方和到质心的平均距离到质心的最大距离
         
聚类141.5930.5780.884
聚类288.7360.9641.656
聚类31012.9211.0931.463

聚类质心

变量聚类1聚类2聚类3总质心
         
客户1.23180.5225-0.91080.0000
回报率1.29420.2217-0.69500.0000
销售量1.18660.5157-0.88720.0000
年数1.20300.5479-0.91950.0000

聚类质心之间的距离

聚类1聚类2聚类3
       
聚类10.00001.59154.1658
聚类21.59150.00002.6488
聚类34.16582.64880.0000
主要结果:到质心的平均距离

在这些结果中,聚类 1 到质心的平均距离最小 (0.578),聚类 3 到质心的平均距离最大 (1.093)。这表明聚类 1 的变异性最小、聚类 3 的变异性最大。但是,聚类 1 的观测值最少 (4),聚类 3 的观测值最多 (10),这在一定程度上解释了变异性的差异。