Hier finden Sie Definitionen und Interpretationen für alle Statistiken, die in den Ergebnissen für die Fusionierungsschritte bereitgestellt werden.

Schritt

Die Nummer des Schritts im Fusionierungsprozess zur Zusammenführung der Cluster. Bei jedem Schritt wird ein neuer Cluster mit einem vorhandenen zusammengeführt, und das Ähnlichkeitsniveau und die Distanzstufe werden berechnet.

Anzahl der Cluster

Die Anzahl der Cluster, die in jedem Schritt des Fusionierungsprozesses gebildet werden. Vor dem ersten Schritt entspricht die Anzahl der Cluster der Gesamtzahl der Beobachtungen (bei Clusterbeobachtungen) bzw. der Gesamtzahl der Variablen (bei Clustervariablen). Im ersten Schritt werden zwei Cluster zu einem neuen Cluster zusammengefasst. Bei jedem nachfolgenden Schritt wird ein weiterer Cluster mit einem vorhandenen zusammengefasst, um einen neuen Cluster zu bilden. Im letzten Schritt werden alle Beobachtungen oder Variablen zu einem einzigen Cluster zusammengefasst.

Sie können die Anzahl der Cluster im Hauptdialogfeld eingeben, um die endgültige Partition für die Daten festzulegen. Das Clusterergebnis wird in erheblichem Maße von Ihrer Auswahl des agglomerativen Verfahrens und des Distanzmaßes beeinflusst.

Ähnlichkeitsniveau

Der Prozentsatz der minimalen Distanz zwischen den Clustern bei jedem Fusionierungsschritt relativ zur maximalen Distanz zwischen den Beobachtungen in den Daten. Die Ähnlichkeit s(ij) zwischen den beiden Clustern i und j wird durch die Gleichung s(ij) = 100 * [1 – d(ij)) / d(max)] berechnet, wobei d(max) der maximale Wert in der ursprünglichen Distanzmatrix D ist und der Eintrag d(ij) für die Distanz zwischen i und j steht.

Interpretation

Verwenden Sie das Ähnlichkeitsniveau für die Cluster, die in den einzelnen Schritten zusammengeführt werden, um die endgültigen Gruppierungen für die Daten zu bestimmen. Suchen Sie nach abrupten Veränderungen des Ähnlichkeitsniveaus zwischen den Schritten. Der Schritt, der der abrupten Veränderung der Ähnlichkeit vorangeht, stellt möglicherweise einen guten Schnittpunkt für die endgültige Partition dar. Für die endgültige Partition sollten die Cluster ein angemessen hohes Ähnlichkeitsniveau aufweisen. Sie sollten auch Ihr Praxiswissen über die Daten anwenden, um die endgültigen Gruppierungen zu bestimmen, die für Ihre Anwendung am sinnvollsten sind.

Die folgende Fusionierungstabelle zeigt beispielsweise, dass das Ähnlichkeitsniveau bis Schritt 15 jeweils ungefähr um höchstens 3 abnimmt. In den Schritten 16 und 17, bei denen sich die Anzahl der Cluster von 4 auf 3 ändert, nimmt die Ähnlichkeit um mehr als 20 ab (von 62,0036 auf 41,0474). Diese Ergebnisse legen nahe, dass 4 Cluster für die endgültige Partition ausreichen. Wenn Ihnen diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar.

Fusionierungsschritte

Anzahl der Zusammengefasste Neuer Schritt Cluster Ähnlichkeitsniveau Distanzstufe Cluster Cluster 1 19 96,6005 0,16275 13 16 13 2 18 95,4642 0,21715 17 20 17 3 17 95,2648 0,22669 6 9 6 4 16 92,9178 0,33905 17 18 17 5 15 90,5296 0,45339 11 15 11 6 14 90,3124 0,46378 12 19 12 7 13 88,2431 0,56285 5 8 5 8 12 88,2431 0,56285 2 14 2 9 11 85,9744 0,67146 6 10 6 10 10 83,0639 0,81080 7 13 7 11 9 83,0639 0,81080 1 3 1 12 8 81,4039 0,89027 2 17 2 13 7 79,8185 0,96617 6 11 6 14 6 78,7534 1,01716 4 12 4 15 5 66,2112 1,61760 2 5 2 16 4 62,0036 1,81904 1 6 1 17 3 41,0474 2,82229 1 4 1 18 2 40,1718 2,86421 2 7 2 19 1 0,0000 4,78739 1 2 1 Anzahl der Beobachtungen in neuem Schritt Cluster 1 2 2 2 3 2 4 3 5 2 6 2 7 2 8 2 9 3 10 3 11 2 12 5 13 5 14 3 15 7 16 7 17 10 18 10 19 20
Endgültige Partition Summe der Quadrate innerhalb Durchschnittliche Maximale Anzahl der des Distanz von Distanz von Beobachtungen Clusters Zentroid Zentroid Cluster1 7 3,25713 0,612540 1,12081 Cluster2 7 2,72247 0,581390 0,95186 Cluster3 3 0,55977 0,398964 0,54907 Cluster4 3 0,37116 0,326533 0,48848
Cluster-Zentroide Variable Cluster1 Cluster2 Cluster3 Cluster4 Gesamtzentroid Geschlecht 0,97468 -0,97468 0,97468 -0,97468 -0,0000000 Größe -1,00352 1,01283 -0,37277 0,35105 0,0000000 Gewicht -0,90672 0,93927 -0,86797 0,79203 -0,0000000 Händigkeit 0,63808 0,63808 -1,48885 -1,48885 0,0000000
Distanzen zwischen Cluster-Zentroiden Cluster1 Cluster2 Cluster3 Cluster4 Cluster1 0,00000 3,35759 2,21882 3,61171 Cluster2 3,35759 0,00000 3,67557 2,23236 Cluster3 2,21882 3,67557 0,00000 2,66074 Cluster4 3,61171 2,23236 2,66074 0,00000
Tipp

Verwenden Sie das Dendrogramm, um die Ähnlichkeitsniveaus in jedem Schritt visuell zu beurteilen.

Distanzstufe

Die Distanz zwischen Clustern (unter Verwendung des ausgewählten agglomerativen Verfahrens) oder Variablen (unter Verwendung des ausgewählten Distanzmaßes), die in den einzelnen Schritten zusammengefasst werden. Minitab berechnet die Distanzstufe auf der Grundlage des agglomerativen Verfahrens und des Distanzmaßes, die Sie im Hauptdialogfeld ausgewählt haben.

Interpretation

Verwenden Sie die Distanzstufe für die Cluster, die in den einzelnen Schritten zusammengeführt werden, um die endgültigen Gruppierungen für die Daten zu bestimmen. Suchen Sie nach abrupten Veränderungen der Distanzstufe zwischen den Schritten. Der Schritt, der der abrupten Veränderung der Distanz vorangeht, stellt möglicherweise einen guten Schnittpunkt für die endgültige Partition dar. Für die endgültige Partition sollten die Cluster eine angemessen kleine Distanzstufe aufweisen. Sie sollten auch Ihr Praxiswissen über die Daten anwenden, um die endgültigen Gruppierungen zu bestimmen, die für Ihre Anwendung am sinnvollsten sind.

Die folgende Fusionierungstabelle zeigt beispielsweise, dass die Distanzstufe in den ersten 15 Schritten jeweils um 0,6 oder weniger ansteigt. Zwischen Schritt 16 und 17, wo sich die Anzahl der Cluster von 4 auf 3 ändert, steigt die Distanzstufe jedoch um mehr als 1 an (von 1,81904 auf 2,82229). Diese Ergebnisse legen nahe, dass möglicherweise 4 Cluster für die endgültige Partition ausreichen. Wenn Ihnen diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar.

Fusionierungsschritte

Anzahl der Zusammengefasste Neuer Schritt Cluster Ähnlichkeitsniveau Distanzstufe Cluster Cluster 1 19 96,6005 0,16275 13 16 13 2 18 95,4642 0,21715 17 20 17 3 17 95,2648 0,22669 6 9 6 4 16 92,9178 0,33905 17 18 17 5 15 90,5296 0,45339 11 15 11 6 14 90,3124 0,46378 12 19 12 7 13 88,2431 0,56285 5 8 5 8 12 88,2431 0,56285 2 14 2 9 11 85,9744 0,67146 6 10 6 10 10 83,0639 0,81080 7 13 7 11 9 83,0639 0,81080 1 3 1 12 8 81,4039 0,89027 2 17 2 13 7 79,8185 0,96617 6 11 6 14 6 78,7534 1,01716 4 12 4 15 5 66,2112 1,61760 2 5 2 16 4 62,0036 1,81904 1 6 1 17 3 41,0474 2,82229 1 4 1 18 2 40,1718 2,86421 2 7 2 19 1 0,0000 4,78739 1 2 1 Anzahl der Beobachtungen in neuem Schritt Cluster 1 2 2 2 3 2 4 3 5 2 6 2 7 2 8 2 9 3 10 3 11 2 12 5 13 5 14 3 15 7 16 7 17 10 18 10 19 20
Endgültige Partition Summe der Quadrate innerhalb Durchschnittliche Maximale Anzahl der des Distanz von Distanz von Beobachtungen Clusters Zentroid Zentroid Cluster1 7 3,25713 0,612540 1,12081 Cluster2 7 2,72247 0,581390 0,95186 Cluster3 3 0,55977 0,398964 0,54907 Cluster4 3 0,37116 0,326533 0,48848
Cluster-Zentroide Variable Cluster1 Cluster2 Cluster3 Cluster4 Gesamtzentroid Geschlecht 0,97468 -0,97468 0,97468 -0,97468 -0,0000000 Größe -1,00352 1,01283 -0,37277 0,35105 0,0000000 Gewicht -0,90672 0,93927 -0,86797 0,79203 -0,0000000 Händigkeit 0,63808 0,63808 -1,48885 -1,48885 0,0000000
Distanzen zwischen Cluster-Zentroiden Cluster1 Cluster2 Cluster3 Cluster4 Cluster1 0,00000 3,35759 2,21882 3,61171 Cluster2 3,35759 0,00000 3,67557 2,23236 Cluster3 2,21882 3,67557 0,00000 2,66074 Cluster4 3,61171 2,23236 2,66074 0,00000

Zusammengefasste Cluster

Die beiden Cluster, die in jedem Schritt des Fusionierungsprozesses zusammengefasst werden, um einen neuen Cluster zu bilden.

Neuer Cluster

Die Identifikationsnummer des neuen Clusters, der in jedem Schritt des Fusionierungsprozesses gebildet wird. Die Identifikationsnummer des neuen Clusters ist immer die kleinere der beiden Identifikationsnummern der zwei zusammengefassten Cluster. Wenn z. B. Cluster 2 und Cluster 9 zusammengefasst werden, wird der neu entstandene Cluster als Cluster 2 bezeichnet.

Anzahl der Beobachtungen im neuen Cluster

Die Anzahl der Beobachtungen in jedem neuen Cluster, der in jedem Schritt des Fusionierungsprozesses gebildet wird. Im letzten Schritt werden alle Beobachtungen in einem einzigen Cluster kombiniert. Daher entspricht die Anzahl der Beobachtungen im neuen Cluster für den letzten Schritt der Gesamtzahl der Beobachtungen in den Daten.

Hinweis

Für Clustervariablen entspricht die Anzahl der Beobachtungen der Anzahl der Variablen im neuen Cluster.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien