解释K 均值聚类的所有统计量和图形

请查找相关定义和解释指导,了解随 K 均值聚类分析提供的每个统计量和图形。

观测值个数

最终分割中每个聚类的观测值个数。

解释

解释变异性的度量时,检查每个聚类中的观测值个数,尤其是平均距离和聚类内平方和。聚类的变异性可能受其具有较小或较大观测值个数的影响。例如,增加更多观测值后,聚类内平方和可能会变大。

检查观测值比其他聚类明显更少的聚类。观测值非常少的聚类可能包含异常值或具有唯一特征的异常观测值。

聚类内平方和

每个观测值与聚类质心的平方差之和。

解释

聚类内平方和度量每个聚类内观测值的变异性。通常,平方和较小的聚类比平方和较大的聚类更紧凑。值越高的聚类表明聚类内的观测值的变异性越大。

但是,类似于方差分析中的平方和均值平方之和,聚类内平方和会受到观测值个数的影响。观测值个数增加,平方和就会变大。因此,聚类内平方和通常不会在具有不同观测值的聚类之间直接比较。要比较不同聚类的聚类内变异性,请使用到质心的平方距离。

到质心的平均距离

从观测值到每个聚类质心的距离平均值。

解释

从观测值到聚类质心的平均距离度量每个聚类内观测值的变异性。通常,具有较小平均距离的聚类比具有较大平均距离的聚类更紧凑。值越高的聚类表明聚类内的观测值的变异性越大。

到质心的最大距离

从观测值到每个聚类质心的距离最大值。

解释

从观测值到聚类质心的最大距离度量每个聚类内观测值的变异性。最大值越高(尤其是相对于平均距离),表明聚类内的观测值距聚类质心越远。

聚类质心

聚类的中心。质心是为每个变量包含一个数字的向量,其中每个数字是该聚类中观测值的一个变量的均值。质心可以认为是聚类的多维平均值。

解释

将聚类质心作为聚类位置的一般度量,可帮助解释每个聚类。每个质心可视为代表分析中所有变量之间聚类的“平均观测值”。

Minitab 会计算包括在最终分割中的聚类质心之前的距离。对于每个聚类,Minitab 还会计算聚类质心和聚类内观测值之间的各种距离度量。有关更多信息,请参见每个距离度量的主题。

总质心

总质心是所有观测值的变量均值向量。

聚类质心之间的距离

聚类质心之间的距离度量最终分割中聚类的质心彼此之间相距多远。

解释

这些距离值本身信息量并不是非常大,但是可以比较距离来了解聚类彼此之间的差异。通常,距离值越大,表明聚类之间差异越大。