クラスター分析 - K-Means法の主要な結果を解釈する

クラスターK平均分析を解釈するには、次の手順を実行します。主要な結果には観測値と最終分割のクラスターのばらつき測度が含まれます。

このトピックの内容

ステップ1：最終グループ化を調べる
ステップ2：クラスターごとのばらつきを評価する

ステップ1：最終グループ化を調べる

最終グループ化を調べて、指定した初期分割に基づいて、最終分割のクラスターが直観的であるかどうかを確認します。クラスターごとの観測値数がグループ化する目的を満たすかどうかをチェックします。1つのクラスターに含まれている観測値数が少なすぎるか多すぎる場合、別な初期分割を使用して分析を再実行したいと考えるかもしれません。

方法

クラスター数	3
標準化された変数	はい

最終分割 (パーティション)

	観測値数	クラスター内の平方和内	重心からの平均距離	重心からの最大距離

クラスター1	4	1.593	0.578	0.884
クラスター2	8	8.736	0.964	1.656
クラスター3	10	12.921	1.093	1.463

クラスター重心

変数	クラスター1	クラスター2	クラスター3	全重心

顧客数	1.2318	0.5225	-0.9108	0.0000
利益率	1.2942	0.2217	-0.6950	0.0000
売上高	1.1866	0.5157	-0.8872	0.0000
年数	1.2030	0.5479	-0.9195	0.0000

クラスター重心間の距離

	クラスター1	クラスター2	クラスター3

クラスター1	0.0000	1.5915	4.1658
クラスター2	1.5915	0.0000	2.6488
クラスター3	4.1658	2.6488	0.0000

主要な結果：最終分割

これらの結果では、22社のデータが、指定された初期分割に基づいてクラスター化され、3つのクラスターになります。クラスター1には4つの観測値が含まれ、より大きな大企業を表します。クラスター2には、8つの観測値が含まれ、中規模の企業を表します。クラスター3には10の観測値が含まれ、新興企業を表します。企業分析者は、これらの最終グループ化がデータ的には十分だと考えます。

注

観測値が属するクラスターを確認するには、分析実行時に保存列を入力する必要があります。ワークシートの列内の観測値ごとにクラスターメンバーシップを保存します。

ステップ2：クラスターごとのばらつきを評価する

重心の測定値からの距離を使用して、クラスター内の観測値のばらつきを調べます。値が高いクラスターは、クラスター内の観測値のばらつきが大きくなることを示します。クラスターのばらつきの差が高すぎる場合、別な初期分割を使用して分析を再実行したいと考えるかもしれません。

方法

クラスター数	3
標準化された変数	はい

最終分割 (パーティション)

	観測値数	クラスター内の平方和内	重心からの平均距離	重心からの最大距離

クラスター1	4	1.593	0.578	0.884
クラスター2	8	8.736	0.964	1.656
クラスター3	10	12.921	1.093	1.463

クラスター重心

変数	クラスター1	クラスター2	クラスター3	全重心

顧客数	1.2318	0.5225	-0.9108	0.0000
利益率	1.2942	0.2217	-0.6950	0.0000
売上高	1.1866	0.5157	-0.8872	0.0000
年数	1.2030	0.5479	-0.9195	0.0000

クラスター重心間の距離

	クラスター1	クラスター2	クラスター3

クラスター1	0.0000	1.5915	4.1658
クラスター2	1.5915	0.0000	2.6488
クラスター3	4.1658	2.6488	0.0000

主要な結果：重心からの平均距離

これらの結果では、重心からの平均距離がクラスター1（0.578）で最小になり、クラスター3で最大（1.093）になります。このことは、クラスター1のばらつきが最小であり、クラスター3のばらつきが最大であることを示します。ただし、クラスター1の観測値数は最も少なく（4）、クラスター3の観測値数は最も多く（10）、ばらつきの差を部分的にしか説明できません。