クラスター平均法の主要な結果を解釈する

クラスターK平均分析を解釈するには、次の手順を実行します。主要な結果には観測値と最終分割のクラスターのばらつき測度が含まれます。

ステップ1:最終グループ化を調べる

最終グループ化を調べて、指定した初期分割に基づいて、最終分割のクラスターが直観的であるかどうかを確認します。クラスターごとの観測値数がグループ化する目的を満たすかどうかをチェックします。1つのクラスターに含まれている観測値数が少なすぎるか多すぎる場合、別な初期分割を使用して分析を再実行したいと考えるかもしれません。

K-meansクラスター分析: 顧客数, 利益率, 売上高, 年数

方法 クラスター数 3 標準化された変数 はい
最終分割 (パーティション) クラス 重心か 重心か 観測 ター内の平 らの平 らの最 値数 方和内 均距離 大距離 クラスター1 4 1.593 0.578 0.884 クラスター2 8 8.736 0.964 1.656 クラスター3 10 12.921 1.093 1.463
クラスター重心 クラス クラス 変数 ター1 ター2 クラスター3 全重心 顧客数 1.2318 0.5225 -0.9108 0.0000 利益率 1.2942 0.2217 -0.6950 0.0000 売上高 1.1866 0.5157 -0.8872 0.0000 年数 1.2030 0.5479 -0.9195 0.0000
クラスター重心間の距離 クラス クラス クラス ター1 ター2 ター3 クラスター1 0.0000 1.5915 4.1658 クラスター2 1.5915 0.0000 2.6488 クラスター3 4.1658 2.6488 0.0000
主要な結果:最終分割

これらの結果では、22社のデータが、指定された初期分割に基づいてクラスター化され、3つのクラスターになります。クラスター1には4つの観測値が含まれ、より大きな大企業を表します。クラスター2には、8つの観測値が含まれ、中規模の企業を表します。クラスター3には10の観測値が含まれ、新興企業を表します。企業分析者は、これらの最終グループ化がデータ的には十分だと考えます。

観測値が属するクラスターを確認するには、分析実行時に保存列を入力する必要があります。ワークシートの列内の観測値ごとにクラスターメンバーシップを保存します。

ステップ2:クラスターごとのばらつきを評価する

重心の測定値からの距離を使用して、クラスター内の観測値のばらつきを調べます。値が高いクラスターは、クラスター内の観測値のばらつきが大きくなることを示します。クラスターのばらつきの差が高すぎる場合、別な初期分割を使用して分析を再実行したいと考えるかもしれません。

K-meansクラスター分析: 顧客数, 利益率, 売上高, 年数

方法 クラスター数 3 標準化された変数 はい
最終分割 (パーティション) クラス 重心か 重心か 観測 ター内の平 らの平 らの最 値数 方和内 均距離 大距離 クラスター1 4 1.593 0.578 0.884 クラスター2 8 8.736 0.964 1.656 クラスター3 10 12.921 1.093 1.463
クラスター重心 クラス クラス 変数 ター1 ター2 クラスター3 全重心 顧客数 1.2318 0.5225 -0.9108 0.0000 利益率 1.2942 0.2217 -0.6950 0.0000 売上高 1.1866 0.5157 -0.8872 0.0000 年数 1.2030 0.5479 -0.9195 0.0000
クラスター重心間の距離 クラス クラス クラス ター1 ター2 ター3 クラスター1 0.0000 1.5915 4.1658 クラスター2 1.5915 0.0000 2.6488 クラスター3 4.1658 2.6488 0.0000
主要な結果:重心からの平均距離

これらの結果では、重心からの平均距離がクラスター1(0.578)で最小になり、クラスター3で最大(1.093)になります。このことは、クラスター1のばらつきが最小であり、クラスター3のばらつきが最大であることを示します。ただし、クラスター1の観測値数は最も少なく(4)、クラスター3の観測値数は最も多く(10)、ばらつきの差を部分的にしか説明できません。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください