クラスター分析 - K-Means法の例

あるビジネス分析者が、活躍のめざましい中小の製造業者22社を、今後の分析のために意味のあるグループに分類したいと考えています。分析者は、顧客数、利益率、売上高、営業年数に関するデータを収集します。分割プロセスを開始するために、これらの会社を初期グループとして大手企業、成長企業、有望企業の3つに分けます。

  1. サンプルデータを開く、ビジネス基準.MTW.
  2. 統計 > 多変量 > クラスター分析 - K-Means法を選択します。
  3. 変数に、顧客数 '利益率' 売上高年数を入力します。
  4. 分割 (パーティション) 指定の下で、初期分割 (パーティション) 列を選択し、初期推測を入力します。
  5. 変数を標準化するを選択します。
  6. 保存をクリックします。クラスター メンバーシップを表す列に、「最終」と入力します。
  7. 各ダイアログボックスでOKをクリックします。

結果を解釈する

ビジネス分析者が設定した最初のグループ化を基に、クラスターK平均法は22社を大企業4社、中堅企業8社、新興企業10社という3つのクラスターに分類します。ワークシート内の最終列の観測値ごとにクラスターメンバーシップを保存します。

クラスター1(大企業)には、3つのクラスターの中でもばらつきが最小であり、重心からの平均距離は最小(0.578)になります。また、クラスター1の観測値数は最も少ないです(4)。

方法

クラスター数3
標準化された変数はい

最終分割 (パーティション)

観測値数クラスター内の平方和内重心からの平均距離重心からの最大距離
         
クラスター141.5930.5780.884
クラスター288.7360.9641.656
クラスター31012.9211.0931.463

クラスター重心

変数クラスター1クラスター2クラスター3全重心
         
顧客数1.23180.5225-0.91080.0000
利益率1.29420.2217-0.69500.0000
売上高1.18660.5157-0.88720.0000
年数1.20300.5479-0.91950.0000

クラスター重心間の距離

クラスター1クラスター2クラスター3
       
クラスター10.00001.59154.1658
クラスター21.59150.00002.6488
クラスター34.16582.64880.0000