クラスター分析 - 変数の例

ある社会科学者は、メディア媒体数、大学数、識字率が、人口に対する大学入学者数に及ぼす影響を調査したいと考えています。そこで、世界の10都市を対象に、人口1,000人当たりの新聞発行数と、ラジオとテレビの台数を集計します。また、識字率と各都市における大学の有無も記録します。科学者は、類似した特性に基づいて変数を合成することにより、変数の合計数を減らしたいと考えています。

  1. サンプルデータを開く、大学入学者数.MTW.
  2. 統計 > 多変量 > クラスター分析 - 変数を選択します。
  3. 変数または距離行列新聞ラジオ 'テレビ' '識字率' 大学を入力します。
  4. 結合手法から、群平均を選択します。
  5. 距離スケールで、相関を選択します。
  6. 樹形図を表示するを選択します。
  7. OKをクリックします。

結果を解釈する

この表は、各ステップで結合されたクラスター、クラスター間の距離、クラスターの類似性を示します。
  • 類似性の水準は、ステップ1(93.9666)からステップ2(93.1548)へわずかに減少し、ステップ3(87.3150)で急に減少し、クラスターの数も3から2に変化します。
  • 結合されたクラスター間の距離は、ステップ1からステップ2にかけておよそ0.017と、わずかに増加し、ステップ3で急に増加し、クラスター数は3から2へ変化します。

距離と類似度の結果は、最終分割では3つのクラスターがかなり十分であることを示します。このグループ化が直観的な意味を持つと社会科学者が考えた場合、これが適していると考えられます。樹形図は、この表内の情報をツリー図の形式で表示したものです。

社会科学者は、分析を戻して、最終分割で3つのクラスターを指定する必要があります。最終分割を指定する場合、追加の表を表示して、最終分割に含まれるクラスターごとの特徴を説明します。

相関係数距離, 平均結合法

併合ステップ

ステップクラスター数類似度の水準距離水準結合されたクラス
ター
新しいクラスター新しいクラスタ
ー内の観測値数
1493.96660.1206692322
2393.15480.1369044542
3287.31500.2537001413
4179.81130.4037751215