クラスター観測値の例

あるスポーツ用品会社のデザイナーが、新しいサッカーのゴールキーパーグローブをテストしたいと考えています。デザイナーは20人のボランティア選手に新しいグローブを着用してもらい、選手の性別、身長、体重、利き手の情報を収集します。そして運動選手を類似度に基づいてグループ分けしたいと考えています。 

  1. サンプルデータを開く、グローブのテスター.MTW.
  2. 統計 > 多変量解析 > クラスター分析 - 観測値を選択します。
  3. 変数または距離行列に、性別 身長 体重 利き手を入力します。
  4. 結合手法から、すべてを選択します。距離スケールから、ユークリッド法を選択します。
  5. 変数を標準化するを選択します。
  6. 樹形図を表示するを選択します。
  7. OKをクリックします。

結果を解釈する

この表は、各ステップで結合されたクラスター、クラスター間の距離、クラスターの類似性を示します。
  • 類似度水準は、ステップ15まで、およそ3以下の単位で減少します。類似度は、ステップ16と17で、20より大きい単位(62.0036から41.0474へ)で減少し、クラスター数は4から3に変化します。
  • 結合されたクラスター間の距離は、およそ0.6以下の単位でまず減少します。距離は、ステップ16と17で、1より大きい単位で(1.81904から2.82229へ)上昇し、クラスター数は4から3に変化します。

距離と類似度の結果は、4つのクラスターが最終分割ではかなり十分になることを示しています。このグループ化が設計者にとって直観的な意味を持つとすれば、これが適していると考えられます。樹形図は、表内の情報をツリー図の形式で表示したものです。

設計者は、分析を戻して、最終分割で4つのクラスターを指定する必要があります。最終分割を指定する場合、追加の表を表示して、最終分割に含まれるクラスターごとの特徴を説明します。

観測値のクラスター分析: 性別, 身長, 体重, 利き手

標準化された変数、 ユークリッド距離, 最長距離リンケージ (最遠隣) 法

併合ステップ 結合さ れたク 新しいクラス クラス 類似 ラス 新しいク ター内の観測 ステップ ター数 度の水準 距離水準 ター ラスター 値数 1 19 96.6005 0.16275 13 16 13 2 2 18 95.4642 0.21715 17 20 17 2 3 17 95.2648 0.22669 6 9 6 2 4 16 92.9178 0.33905 17 18 17 3 5 15 90.5296 0.45339 11 15 11 2 6 14 90.3124 0.46378 12 19 12 2 7 13 88.2431 0.56285 5 8 5 2 8 12 88.2431 0.56285 2 14 2 2 9 11 85.9744 0.67146 6 10 6 3 10 10 83.0639 0.81080 7 13 7 3 11 9 83.0639 0.81080 1 3 1 2 12 8 81.4039 0.89027 2 17 2 5 13 7 79.8185 0.96617 6 11 6 5 14 6 78.7534 1.01716 4 12 4 3 15 5 66.2112 1.61760 2 5 2 7 16 4 62.0036 1.81904 1 6 1 7 17 3 41.0474 2.82229 1 4 1 10 18 2 40.1718 2.86421 2 7 2 10 19 1 0.0000 4.78739 1 2 1 20
最終分割 (パーティション) クラス 観測 ター内の平 重心から 重心から 値数 方和内 の平均距離 の最大距離 クラスター1 20 76 1.91323 2.53613

樹形図

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください