クラスター分析 - K-Means法の主要な結果を解釈する

クラスターK平均分析を解釈するには、次の手順を実行します。主要な結果には観測値と最終分割のクラスターのばらつき測度が含まれます。

ステップ1:最終グループ化を調べる

最終グループ化を調べて、指定した初期分割に基づいて、最終分割のクラスターが直観的であるかどうかを確認します。クラスターごとの観測値数がグループ化する目的を満たすかどうかをチェックします。1つのクラスターに含まれている観測値数が少なすぎるか多すぎる場合、別な初期分割を使用して分析を再実行したいと考えるかもしれません。

方法

クラスター数3
標準化された変数はい

最終分割 (パーティション)

観測値数クラスター内の平方和内重心からの平均距離重心からの最大距離
         
クラスター141.5930.5780.884
クラスター288.7360.9641.656
クラスター31012.9211.0931.463

クラスター重心

変数クラスター1クラスター2クラスター3全重心
         
顧客数1.23180.5225-0.91080.0000
利益率1.29420.2217-0.69500.0000
売上高1.18660.5157-0.88720.0000
年数1.20300.5479-0.91950.0000

クラスター重心間の距離

クラスター1クラスター2クラスター3
       
クラスター10.00001.59154.1658
クラスター21.59150.00002.6488
クラスター34.16582.64880.0000
主要な結果:最終分割

これらの結果では、22社のデータが、指定された初期分割に基づいてクラスター化され、3つのクラスターになります。クラスター1には4つの観測値が含まれ、より大きな大企業を表します。クラスター2には、8つの観測値が含まれ、中規模の企業を表します。クラスター3には10の観測値が含まれ、新興企業を表します。企業分析者は、これらの最終グループ化がデータ的には十分だと考えます。

観測値が属するクラスターを確認するには、分析実行時に保存列を入力する必要があります。ワークシートの列内の観測値ごとにクラスターメンバーシップを保存します。

ステップ2:クラスターごとのばらつきを評価する

重心の測定値からの距離を使用して、クラスター内の観測値のばらつきを調べます。値が高いクラスターは、クラスター内の観測値のばらつきが大きくなることを示します。クラスターのばらつきの差が高すぎる場合、別な初期分割を使用して分析を再実行したいと考えるかもしれません。

方法

クラスター数3
標準化された変数はい

最終分割 (パーティション)

観測値数クラスター内の平方和内重心からの平均距離重心からの最大距離
         
クラスター141.5930.5780.884
クラスター288.7360.9641.656
クラスター31012.9211.0931.463

クラスター重心

変数クラスター1クラスター2クラスター3全重心
         
顧客数1.23180.5225-0.91080.0000
利益率1.29420.2217-0.69500.0000
売上高1.18660.5157-0.88720.0000
年数1.20300.5479-0.91950.0000

クラスター重心間の距離

クラスター1クラスター2クラスター3
       
クラスター10.00001.59154.1658
クラスター21.59150.00002.6488
クラスター34.16582.64880.0000
主要な結果:重心からの平均距離

これらの結果では、重心からの平均距離がクラスター1(0.578)で最小になり、クラスター3で最大(1.093)になります。このことは、クラスター1のばらつきが最小であり、クラスター3のばらつきが最大であることを示します。ただし、クラスター1の観測値数は最も少なく(4)、クラスター3の観測値数は最も多く(10)、ばらつきの差を部分的にしか説明できません。