Bestimmen der endgültigen Gruppierung von Clustern

Die endgültige Gruppierung von Clustern (auch als endgültige Partition bezeichnet) ist die Gruppierung von Clustern, mit der Gruppen identifiziert werden sollten, deren Beobachtungen oder Variablen gemeinsame Merkmale aufweisen. Die Entscheidung über die endgültige Gruppierung wird auch als Beschneiden des Dendrogramms bezeichnet. Das vollständige Dendrogramm (Baumdiagramm) ist eine grafische Darstellung der Vereinigung von Beobachtungen oder Variablen zu einem Cluster. Das Beschneiden des Dendrogramms ähnelt dem Zeichnen einer Linie durch das Dendrogramm, um die endgültige Gruppierung festzulegen. Die folgenden Schritte können Sie dabei unterstützen, die Position zu bestimmen, an der das Dendrogramm beschnitten werden soll.

  1. Führen Sie eine Clusteranalyse mit der Standardeinstellung durch (1 Cluster in der endgültigen Partition). Minitab zeigt die Ergebnisse für alle möglichen Clusteranzahlen an.
  2. Überprüfen Sie in der ausgegebenen Tabelle und im Dendrogram das Ähnlichkeitsniveau und die Distanzstufe. Sie können die Ähnlichkeitsniveaus anzeigen, indem Sie den Mauszeiger über einer horizontalen Linie im Dendrogramm platzieren. Bei dem Ähnlichkeitsniveau handelt es sich in jedem Schritt um den Prozentsatz der minimalen Distanz bei diesem Schritt relativ zur maximalen Distanz zwischen Beobachtungen in den Daten.
  3. Wählen Sie aus, an welcher Position die endgültige Partition vorgenommen werden soll. Das Muster der Änderungen der Ähnlichkeits- oder Distanzwerte zwischen den einzelnen Schritten bietet Orientierung für die Auswahl der endgültigen Gruppierung. Der Schritt, bei dem sich die Werte abrupt ändern, kann eine gute Position zum Beschneiden des Dendrogramms darstellen, sofern dies für die vorliegenden Daten sinnvoll erscheint.
  4. Führen Sie die Clusterprozedur erneut durch, und verwenden Sie dabei entweder Anzahl der Cluster oder Ähnlichkeitsniveau, um entweder eine festgelegte Anzahl von Gruppen oder ein Ähnlichkeitsniveau zum Beschneiden des Dendrogramms anzugeben.
  5. Untersuchen Sie die resultierenden Cluster der endgültigen Partition, um zu bestimmen, ob die Gruppierung sinnvoll ist. Die Untersuchung von Dendrogrammen auf unterschiedliche endgültige Gruppierungen kann auch die Entscheidung erleichtern, welche davon für Ihre Daten am folgerichtigsten ist.
Hinweis

Bei einigen Datensätzen führen die durchschnittliche, Zentroid-, Median- oder Ward-Methode möglicherweise nicht zu einem hierarchischen Dendrogramm. Dies bedeutet, dass die Fusionierungsdistanzen nicht immer mit jedem Schritt zunehmen. Im Dendrogramm führt ein solcher Schritt zu einer Verbindungslinie nach unten und nicht nach oben.