Beispiel für Clustervariablen

Ein Sozialwissenschaftler möchte die Auswirkungen der Anzahl von Medienangeboten und höheren Bildungseinrichtungen sowie der Alphabetisierungsrate auf die Zulassungen an Hochschulen bezogen auf die Bevölkerung untersuchen. Der Wissenschaftler bestimmt für 10 Großstädte weltweit die Auflage von Zeitungen sowie die Anzahl von Radios und Fernsehgeräten je 1.000 Personen. Zudem erfasst er die Alphabetisierungsrate und den Umstand, ob die einzelnen Städte über eine Universität verfügen. Der Wissenschaftler möchte die Gesamtzahl der Variablen verringern, indem er Variablen mit ähnlichen Merkmalen kombiniert.

  1. Öffnen Sie den Beispieldatensatz Hochschulzulassungen.MTW.
  2. Wählen Sie Statistik > Multivariate Analysen > Clustervariablen aus.
  3. Geben Sie im Feld Variablen oder Distanzmatrix die Spalten Zeitung Radios 'Fernsehgeräte' 'Alphabetisierungsrate' Universität ein.
  4. Wählen Sie im Feld Agglomeratives Verfahren die Option Durchschnitt aus.
  5. Wählen Sie unter Distanzmaß die Option Korrelation aus.
  6. Wählen Sie Dendrogramm anzeigen aus.
  7. Klicken Sie auf OK.

Interpretieren der Ergebnisse

In der Tabelle werden die Cluster, die in den einzelnen Schritten zusammengefasst wurden, die Distanz zwischen den Clustern und die Ähnlichkeit der Cluster angezeigt.
  • Das Ähnlichkeitsniveau nimmt von Schritt 1 (93,9666) zu Schritt 2 (93,1548) leicht und dann in Schritt 3, bei dem sich die Anzahl der Cluster von 3 auf 2 ändert, abrupt ab (87,3150).
  • Die Distanz zwischen den zusammengefassten Clustern erhöht sich von Schritt 1 zu Schritt 2 leicht um 0,017 und nimmt dann in Schritt 3, bei dem sich die Anzahl der Cluster von 3 auf 2 ändert, stärker zu.

Diese Ergebnisse in Hinblick auf Ähnlichkeit und Distanz legen nahe, dass 3 Cluster für die endgültige Partition ausreichen. Wenn dem Sozialwissenschaftler diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar. Im Dendrogramm werden die Informationen in der Tabelle in Form eines Baumdiagramms angezeigt.

Der Sozialwissenschaftler sollte die Analyse erneut ausführen und für die endgültige Partition 3 Cluster angeben. Wenn Sie eine endgültige Partition angeben, zeigt Minitab zusätzliche Tabellen an, in denen die Merkmale jedes in der endgültigen Partition enthaltenen Clusters beschrieben werden.

Clusteranalyse von Variablen: Zeitung; Radios; Fernsehgerät; Alphabetisie; ...

Korrelationskoeffizientendistanz, Durchschnittliche Kopplung

Fusionierungsschritte

Anzahl der Zusammengefasste Neuer Schritt Cluster Ähnlichkeitsniveau Distanzstufe Cluster Cluster 1 4 93,9666 0,120669 2 3 2 2 3 93,1548 0,136904 4 5 4 3 2 87,3150 0,253700 1 4 1 4 1 79,8113 0,403775 1 2 1 Anzahl der Beobachtungen in neuem Schritt Cluster 1 2 2 2 3 3 4 5
Endgültige Partition Variablen Cluster 1 Zeitung Cluster 2 Radios Fernsehgeräte Cluster 3 Alphabetisierungsrate Universität

Dendrogramm

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien