解释K 均值聚类的主要结果

请完成以下步骤来解释 k 均值聚类分析。主要输出包括最终分割中聚类的观测值和变异性度量。

步骤 1:检查最终分组

基于您指定的初始分割,检查最终分组并查看最终分割中的聚类是否具有直观意义。检查每个聚类中的观测值个数是否符合您的分组目标。如果一个聚类包含过少或过多观测值,您可能要使用另一个初始分割重新运行分析。

K 均值聚类分析: 客户, 回报率, 销售量, 年数

方法 点群数 3 标准化变量 是
最终分割 观测值 到质心的 到质心的 个数 类内平方和 平均距离 最大距离 聚类1 4 1.593 0.578 0.884 聚类2 8 8.736 0.964 1.656 聚类3 10 12.921 1.093 1.463
聚类质心 变量 聚类1 聚类2 聚类3 总质心 客户 1.2318 0.5225 -0.9108 0.0000 回报率 1.2942 0.2217 -0.6950 0.0000 销售量 1.1866 0.5157 -0.8872 0.0000 年数 1.2030 0.5479 -0.9195 0.0000
聚类质心之间的距离 聚类1 聚类2 聚类3 聚类1 0.0000 1.5915 4.1658 聚类2 1.5915 0.0000 2.6488 聚类3 4.1658 2.6488 0.0000
主要结果:最终分割

在这些结果中,Minitab 根据指定的初始分割将 22 家公司的数据聚类到 3 个聚类。聚类 1 包含 4 个观测值,代表更大的成熟公司。聚类 2 包含 8 个观测值,代表中等成长型公司。聚类 3 包含 10 个观测值,代表新公司。商业分析师认为这些最终分组对于数据是足够的。

注意

要查看每个观测值所属的聚类,必须在执行分析时输入存储列。Minitab 将各个观测值的聚类成员存储在工作表的列中。

步骤 2:评估每个聚类内的变异性

使用到质心的距离度量检查每个聚类内观测值的变异性。具有较高值的聚类表明聚类内观测值的变异性较高。如果聚类之间的变异性差别过大,则可能要使用另一个初始分割重新运行分析。

K 均值聚类分析: 客户, 回报率, 销售量, 年数

方法 点群数 3 标准化变量 是
最终分割 观测值 到质心的 到质心的 个数 类内平方和 平均距离 最大距离 聚类1 4 1.593 0.578 0.884 聚类2 8 8.736 0.964 1.656 聚类3 10 12.921 1.093 1.463
聚类质心 变量 聚类1 聚类2 聚类3 总质心 客户 1.2318 0.5225 -0.9108 0.0000 回报率 1.2942 0.2217 -0.6950 0.0000 销售量 1.1866 0.5157 -0.8872 0.0000 年数 1.2030 0.5479 -0.9195 0.0000
聚类质心之间的距离 聚类1 聚类2 聚类3 聚类1 0.0000 1.5915 4.1658 聚类2 1.5915 0.0000 2.6488 聚类3 4.1658 2.6488 0.0000
主要结果:到质心的平均距离

在这些结果中,聚类 1 到质心的平均距离最小 (0.578),聚类 3 到质心的平均距离最大 (1.093)。这表明聚类 1 的变异性最小、聚类 3 的变异性最大。但是,聚类 1 的观测值最少 (4),聚类 3 的观测值最多 (10),这在一定程度上解释了变异性的差异。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策