Beispiel für Clusterbeobachtungen

Ein Designer von Sportartikeln für einen Sportausstatter möchte neue Torwarthandschuhe testen. Der Designer bittet 20 Sportler, die neuen Handschuhe auszuprobieren, und erfasst deren Geschlecht, Größe, Gewicht und Händigkeit. Der Designer möchte die Sportler nach Ähnlichkeiten gruppieren.

  1. Öffnen Sie den Beispieldatensatz Handschuhtester.MTW.
  2. Wählen Sie Statistik > Multivariate Analysen > Clusterbeobachtungen aus.
  3. Geben Sie im Feld Variablen oder Distanzmatrix die Spalten GeschlechtGrößeGewichtHändigkeit ein.
  4. Wählen Sie im Feld Agglomeratives Verfahren die Option Vollständig aus. Wählen Sie im Feld Distanzmaß die Option Euklidisch aus.
  5. Wählen Sie Variablen standardisieren aus.
  6. Wählen Sie Dendrogramm anzeigen aus.
  7. Klicken Sie auf OK.

Interpretieren der Ergebnisse

In der Tabelle werden die Cluster, die in den einzelnen Schritten zusammengefasst wurden, die Distanz zwischen den Clustern und die Ähnlichkeit der Cluster angezeigt.
  • Das Ähnlichkeitsniveau nimmt bis Schritt 15 jeweils ungefähr um maximal 3 ab. In den Schritten 16 und 17, bei denen sich die Anzahl der Cluster von 4 auf 3 ändert, nimmt die Ähnlichkeit um mehr als 20 ab (von 62,0036 auf 41,0474).
  • Die Distanz zwischen den zusammengefassten Clustern nimmt zu, zuerst um maximal ungefähr 0,6. In den Schritten 16 und 17, bei denen sich die Anzahl der Cluster von 4 auf 3 ändert, steigt die Distanz um mehr als 1 an (von 1,81904 auf 2,82229).

Diese Ergebnisse in Hinblick auf Ähnlichkeit und Distanz legen nahe, dass 4 Cluster für die endgültige Partition ausreichen. Wenn diese Gruppierung dem Designer intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar. Im Dendrogramm werden die Informationen in der Tabelle in Form eines Baumdiagramms angezeigt.

Der Designer sollte die Analyse erneut ausführen und für die endgültige Partition 4 Cluster angeben. Wenn Sie eine endgültige Partition angeben, zeigt Minitab zusätzliche Tabellen an, in denen die Merkmale jedes in der endgültigen Partition enthaltenen Clusters beschrieben werden.

Standardisierte Variablen, Euklidische Distanz, Vollständige Kopplung

Fusionierungsschritte

SchrittAnzahl
der
Cluster
ÄhnlichkeitsniveauDistanzstufeZusammengefasste
Cluster
Neuer
Cluster
Anzahl der
Beobachtungen
in neuem
Cluster
11996,60050,162751316132
21895,46420,217151720172
31795,26480,226696962
41692,91780,339051718173
51590,52960,453391115112
61490,31240,463781219122
71388,24310,5628521422
81288,24310,562855852
91185,97440,6714661063
101083,06390,8108071373
11983,06390,810801312
12881,40390,8902721725
13779,81850,9661761165
14678,75341,0171641243
15566,21121,617602527
16462,00361,819041617
17341,04742,8222914110
18240,17182,8642127210
1910,00004,7873912120

Endgültige Partition

Anzahl der
Beobachtungen
Summe der
Quadrate
innerhalb
des
Clusters
Durchschnittliche
Distanz von
Zentroid
Maximale
Distanz von
Zentroid
Cluster120761,913232,53613