Hier finden Sie Definitionen und Interpretationen für alle Statistiken, die in den Ergebnissen für die Fusionierungsschritte bereitgestellt werden.

Schritt

Die Nummer des Schritts im Fusionierungsprozess zur Zusammenführung der Cluster. Bei jedem Schritt wird ein neuer Cluster mit einem vorhandenen zusammengeführt, und das Ähnlichkeitsniveau und die Distanzstufe werden berechnet.

Anzahl der Cluster

Die Anzahl der Cluster, die in jedem Schritt des Fusionierungsprozesses gebildet werden. Vor dem ersten Schritt entspricht die Anzahl der Cluster der Gesamtzahl der Beobachtungen (bei Clusterbeobachtungen) bzw. der Gesamtzahl der Variablen (bei Clustervariablen). Im ersten Schritt werden zwei Cluster zu einem neuen Cluster zusammengefasst. Bei jedem nachfolgenden Schritt wird ein weiterer Cluster mit einem vorhandenen zusammengefasst, um einen neuen Cluster zu bilden. Im letzten Schritt werden alle Beobachtungen oder Variablen zu einem einzigen Cluster zusammengefasst.

Sie können die Anzahl der Cluster im Hauptdialogfeld eingeben, um die endgültige Partition für die Daten festzulegen. Das Clusterergebnis wird in erheblichem Maße von Ihrer Auswahl des agglomerativen Verfahrens und des Distanzmaßes beeinflusst.

Ähnlichkeitsniveau

Der Prozentsatz der minimalen Distanz zwischen den Clustern bei jedem Fusionierungsschritt relativ zur maximalen Distanz zwischen den Beobachtungen in den Daten. Die Ähnlichkeit s(ij) zwischen den beiden Clustern i und j wird durch die Gleichung s(ij) = 100 * [1 – d(ij)) / d(max)] berechnet, wobei d(max) der maximale Wert in der ursprünglichen Distanzmatrix D ist und der Eintrag d(ij) für die Distanz zwischen i und j steht.

Interpretation

Verwenden Sie das Ähnlichkeitsniveau für die Cluster, die in den einzelnen Schritten zusammengeführt werden, um die endgültigen Gruppierungen für die Daten zu bestimmen.Suchen Sie nach abrupten Veränderungen des Ähnlichkeitsniveaus zwischen den Schritten. Der Schritt, der der abrupten Veränderung der Ähnlichkeit vorangeht, stellt möglicherweise einen guten Schnittpunkt für die endgültige Partition dar. Für die endgültige Partition sollten die Cluster ein angemessen hohes Ähnlichkeitsniveau aufweisen. Sie sollten auch Ihr Praxiswissen über die Daten anwenden, um die endgültigen Gruppierungen zu bestimmen, die für Ihre Anwendung am sinnvollsten sind.

Die folgende Fusionierungstabelle zeigt beispielsweise, dass das Ähnlichkeitsniveau bis Schritt 15 jeweils ungefähr um höchstens 3 abnimmt. In den Schritten 16 und 17, bei denen sich die Anzahl der Cluster von 4 auf 3 ändert, nimmt die Ähnlichkeit um mehr als 20 ab (von 62,0036 auf 41,0474). Diese Ergebnisse legen nahe, dass 4 Cluster für die endgültige Partition ausreichen. Wenn Ihnen diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar.

Fusionierungsschritte

SchrittAnzahl
der
Cluster
ÄhnlichkeitsniveauDistanzstufeZusammengefasste
Cluster
Neuer
Cluster
Anzahl der
Beobachtungen
in neuem
Cluster
11996,60050,162751316132
21895,46420,217151720172
31795,26480,226696962
41692,91780,339051718173
51590,52960,453391115112
61490,31240,463781219122
71388,24310,5628521422
81288,24310,562855852
91185,97440,6714661063
101083,06390,8108071373
11983,06390,810801312
12881,40390,8902721725
13779,81850,9661761165
14678,75341,0171641243
15566,21121,617602527
16462,00361,819041617
17341,04742,8222914110
18240,17182,8642127210
1910,00004,7873912120
Tipp

Verwenden Sie das Dendrogramm, um die Ähnlichkeitsniveaus in jedem Schritt visuell zu beurteilen.

Distanzstufe

Die Distanz zwischen Clustern (unter Verwendung des ausgewählten agglomerativen Verfahrens) oder Variablen (unter Verwendung des ausgewählten Distanzmaßes), die in den einzelnen Schritten zusammengefasst werden. Minitab berechnet die Distanzstufe auf der Grundlage des agglomerativen Verfahrens und des Distanzmaßes, die Sie im Hauptdialogfeld ausgewählt haben.

Interpretation

Verwenden Sie die Distanzstufe für die Cluster, die in den einzelnen Schritten zusammengeführt werden, um die endgültigen Gruppierungen für die Daten zu bestimmen. Suchen Sie nach abrupten Veränderungen der Distanzstufe zwischen den Schritten. Der Schritt, der der abrupten Veränderung der Distanz vorangeht, stellt möglicherweise einen guten Schnittpunkt für die endgültige Partition dar. Für die endgültige Partition sollten die Cluster eine angemessen kleine Distanzstufe aufweisen. Sie sollten auch Ihr Praxiswissen über die Daten anwenden, um die endgültigen Gruppierungen zu bestimmen, die für Ihre Anwendung am sinnvollsten sind.

Die folgende Fusionierungstabelle zeigt beispielsweise, dass die Distanzstufe in den ersten 15 Schritten jeweils um 0,6 oder weniger ansteigt. Zwischen Schritt 16 und 17, wo sich die Anzahl der Cluster von 4 auf 3 ändert, steigt die Distanzstufe jedoch um mehr als 1 an (von 1,81904 auf 2,82229). Diese Ergebnisse legen nahe, dass möglicherweise 4 Cluster für die endgültige Partition ausreichen. Wenn Ihnen diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar.

Fusionierungsschritte

SchrittAnzahl
der
Cluster
ÄhnlichkeitsniveauDistanzstufeZusammengefasste
Cluster
Neuer
Cluster
Anzahl der
Beobachtungen
in neuem
Cluster
11996,60050,162751316132
21895,46420,217151720172
31795,26480,226696962
41692,91780,339051718173
51590,52960,453391115112
61490,31240,463781219122
71388,24310,5628521422
81288,24310,562855852
91185,97440,6714661063
101083,06390,8108071373
11983,06390,810801312
12881,40390,8902721725
13779,81850,9661761165
14678,75341,0171641243
15566,21121,617602527
16462,00361,819041617
17341,04742,8222914110
18240,17182,8642127210
1910,00004,7873912120

Zusammengefasste Cluster

Die beiden Cluster, die in jedem Schritt des Fusionierungsprozesses zusammengefasst werden, um einen neuen Cluster zu bilden.

Neuer Cluster

Die Identifikationsnummer des neuen Clusters, der in jedem Schritt des Fusionierungsprozesses gebildet wird. Die Identifikationsnummer des neuen Clusters ist immer die kleinere der beiden Identifikationsnummern der zwei zusammengefassten Cluster. Wenn z. B. Cluster 2 und Cluster 9 zusammengefasst werden, wird der neu entstandene Cluster als Cluster 2 bezeichnet.

Anzahl der Beobachtungen im neuen Cluster

Die Anzahl der Beobachtungen in jedem neuen Cluster, der in jedem Schritt des Fusionierungsprozesses gebildet wird. Im letzten Schritt werden alle Beobachtungen in einem einzigen Cluster kombiniert. Daher entspricht die Anzahl der Beobachtungen im neuen Cluster für den letzten Schritt der Gesamtzahl der Beobachtungen in den Daten.

Hinweis

Für Clustervariablen entspricht die Anzahl der Beobachtungen der Anzahl der Variablen im neuen Cluster.