K 均值聚类首先将观测值分组为预定义数量的聚类。之后,Minitab 通过执行以下步骤形成聚类:
- Minitab 会评估每个观测值,并将其移到最近的聚类中。最近的聚类是指观测值与聚类质心之间的 Euclidean 距离最小的聚类。
- 聚类发生变化(丢失或获得观测值)时,Minitab 会重新计算聚类质心。
- 此过程将重复进行,直至无法再将更多的观测值移动到其他聚类中。此时,根据上面所列的标准,所有观测值都位于最近的聚类中。
与观测值的分层聚类不同的是,K 均值聚类过程最初合并在一起的两个观测值之后还可以分割到不同的聚类内。
K 均值过程最适合为聚类提供有效起始点的情况。