Beispiel für Clustervariablen

Ein Sozialwissenschaftler möchte die Auswirkungen der Anzahl von Medienangeboten und höheren Bildungseinrichtungen sowie der Alphabetisierungsrate auf die Zulassungen an Hochschulen bezogen auf die Bevölkerung untersuchen. Der Wissenschaftler bestimmt für 10 Großstädte weltweit die Auflage von Zeitungen sowie die Anzahl von Radios und Fernsehgeräten je 1.000 Personen. Zudem erfasst er die Alphabetisierungsrate und den Umstand, ob die einzelnen Städte über eine Universität verfügen. Der Wissenschaftler möchte die Gesamtzahl der Variablen verringern, indem er Variablen mit ähnlichen Merkmalen kombiniert.

  1. Öffnen Sie den Beispieldatensatz Hochschulzulassungen.MTW.
  2. Wählen Sie Statistik > Multivariate Analysen > Clustervariablen aus.
  3. Geben Sie im Feld Variablen oder Distanzmatrix die Spalten ZeitungRadios 'Fernsehgeräte' 'Alphabetisierungsrate' Universität ein.
  4. Wählen Sie im Feld Agglomeratives Verfahren die Option Durchschnitt aus.
  5. Wählen Sie unter Distanzmaß die Option Korrelation aus.
  6. Wählen Sie Dendrogramm anzeigen aus.
  7. Klicken Sie auf OK.

Interpretieren der Ergebnisse

In der Tabelle werden die Cluster, die in den einzelnen Schritten zusammengefasst wurden, die Distanz zwischen den Clustern und die Ähnlichkeit der Cluster angezeigt.
  • Das Ähnlichkeitsniveau nimmt von Schritt 1 (93,9666) zu Schritt 2 (93,1548) leicht und dann in Schritt 3, bei dem sich die Anzahl der Cluster von 3 auf 2 ändert, abrupt ab (87,3150).
  • Die Distanz zwischen den zusammengefassten Clustern erhöht sich von Schritt 1 zu Schritt 2 leicht um 0,017 und nimmt dann in Schritt 3, bei dem sich die Anzahl der Cluster von 3 auf 2 ändert, stärker zu.

Diese Ergebnisse in Hinblick auf Ähnlichkeit und Distanz legen nahe, dass 3 Cluster für die endgültige Partition ausreichen. Wenn dem Sozialwissenschaftler diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar. Im Dendrogramm werden die Informationen in der Tabelle in Form eines Baumdiagramms angezeigt.

Der Sozialwissenschaftler sollte die Analyse erneut ausführen und für die endgültige Partition 3 Cluster angeben. Wenn Sie eine endgültige Partition angeben, zeigt Minitab zusätzliche Tabellen an, in denen die Merkmale jedes in der endgültigen Partition enthaltenen Clusters beschrieben werden.

Korrelationskoeffizientendistanz, Durchschnittliche Kopplung

Fusionierungsschritte

SchrittAnzahl
der
Cluster
ÄhnlichkeitsniveauDistanzstufeZusammengefasste
Cluster
Neuer
Cluster
Anzahl der
Beobachtungen
in neuem
Cluster
1493,96660,1206692322
2393,15480,1369044542
3287,31500,2537001413
4179,81130,4037751215