クラスター分析 - 観測値の例

あるスポーツ用品会社のデザイナーが、新しいサッカーのゴールキーパーグローブをテストしたいと考えています。デザイナーは20人のボランティア選手に新しいグローブを着用してもらい、選手の性別、身長、体重、利き手の情報を収集します。そして運動選手を類似度に基づいてグループ分けしたいと考えています。 

  1. サンプルデータを開く、グローブのテスター.MTW.
  2. 統計 > 多変量 > クラスター分析 - 観測値を選択します。
  3. 変数または距離行列に、性別身長体重利き手を入力します。
  4. 結合手法から、すべてを選択します。距離スケールから、ユークリッド法を選択します。
  5. 変数を標準化するを選択します。
  6. 樹形図を表示するを選択します。
  7. OKをクリックします。

結果を解釈する

この表は、各ステップで結合されたクラスター、クラスター間の距離、クラスターの類似性を示します。
  • 類似度水準は、ステップ15まで、およそ3以下の単位で減少します。類似度は、ステップ16と17で、20より大きい単位(62.0036から41.0474へ)で減少し、クラスター数は4から3に変化します。
  • 結合されたクラスター間の距離は、およそ0.6以下の単位でまず減少します。距離は、ステップ16と17で、1より大きい単位で(1.81904から2.82229へ)上昇し、クラスター数は4から3に変化します。

距離と類似度の結果は、4つのクラスターが最終分割ではかなり十分になることを示しています。このグループ化が設計者にとって直観的な意味を持つとすれば、これが適していると考えられます。樹形図は、表内の情報をツリー図の形式で表示したものです。

設計者は、分析を戻して、最終分割で4つのクラスターを指定する必要があります。最終分割を指定する場合、追加の表を表示して、最終分割に含まれるクラスターごとの特徴を説明します。

標準化された変数、 ユークリッド距離, 最長距離リンケージ (最遠隣) 法

併合ステップ

ステップクラスター数類似度の水準距離水準結合されたクラスター新しいクラスター新しいクラスタ
ー内の観測値数
11996.60050.162751316132
21895.46420.217151720172
31795.26480.226696962
41692.91780.339051718173
51590.52960.453391115112
61490.31240.463781219122
71388.24310.5628521422
81288.24310.562855852
91185.97440.6714661063
101083.06390.8108071373
11983.06390.810801312
12881.40390.8902721725
13779.81850.9661761165
14678.75341.0171641243
15566.21121.617602527
16462.00361.819041617
17341.04742.8222914110
18240.17182.8642127210
1910.00004.7873912120

最終分割 (パーティション)

観測値数クラスター内の平方和内重心からの平均距離重心からの最大距離
クラスター120761.913232.53613