Fusionierungsschritte

Hier finden Sie Definitionen und Interpretationen für alle Statistiken, die in den Ergebnissen für die Fusionierungsschritte bereitgestellt werden.

In diesem Thema

Schritt
Anzahl der Cluster
Ähnlichkeitsniveau
Distanzstufe
Zusammengefasste Cluster
Neuer Cluster
Anzahl der Beobachtungen im neuen Cluster

Schritt

Die Nummer des Schritts im Fusionierungsprozess zur Zusammenführung der Cluster. Bei jedem Schritt wird ein neuer Cluster mit einem vorhandenen zusammengeführt, und das Ähnlichkeitsniveau und die Distanzstufe werden berechnet.

Anzahl der Cluster

Die Anzahl der Cluster, die in jedem Schritt des Fusionierungsprozesses gebildet werden. Vor dem ersten Schritt entspricht die Anzahl der Cluster der Gesamtzahl der Beobachtungen (bei Clusterbeobachtungen) bzw. der Gesamtzahl der Variablen (bei Clustervariablen). Im ersten Schritt werden zwei Cluster zu einem neuen Cluster zusammengefasst. Bei jedem nachfolgenden Schritt wird ein weiterer Cluster mit einem vorhandenen zusammengefasst, um einen neuen Cluster zu bilden. Im letzten Schritt werden alle Beobachtungen oder Variablen zu einem einzigen Cluster zusammengefasst.

Sie können die Anzahl der Cluster im Hauptdialogfeld eingeben, um die endgültige Partition für die Daten festzulegen. Das Clusterergebnis wird in erheblichem Maße von Ihrer Auswahl des agglomerativen Verfahrens und des Distanzmaßes beeinflusst.

Ähnlichkeitsniveau

Der Prozentsatz der minimalen Distanz zwischen den Clustern bei jedem Fusionierungsschritt relativ zur maximalen Distanz zwischen den Beobachtungen in den Daten. Die Ähnlichkeit s(ij) zwischen den beiden Clustern i und j wird durch die Gleichung s(ij) = 100 * [1 – d(ij)) / d(max)] berechnet, wobei d(max) der maximale Wert in der ursprünglichen Distanzmatrix D ist und der Eintrag d(ij) für die Distanz zwischen i und j steht.

Interpretation

Verwenden Sie das Ähnlichkeitsniveau für die Cluster, die in den einzelnen Schritten zusammengeführt werden, um die endgültigen Gruppierungen für die Daten zu bestimmen.Suchen Sie nach abrupten Veränderungen des Ähnlichkeitsniveaus zwischen den Schritten. Der Schritt, der der abrupten Veränderung der Ähnlichkeit vorangeht, stellt möglicherweise einen guten Schnittpunkt für die endgültige Partition dar. Für die endgültige Partition sollten die Cluster ein angemessen hohes Ähnlichkeitsniveau aufweisen. Sie sollten auch Ihr Praxiswissen über die Daten anwenden, um die endgültigen Gruppierungen zu bestimmen, die für Ihre Anwendung am sinnvollsten sind.

Die folgende Fusionierungstabelle zeigt beispielsweise, dass das Ähnlichkeitsniveau bis Schritt 15 jeweils ungefähr um höchstens 3 abnimmt. In den Schritten 16 und 17, bei denen sich die Anzahl der Cluster von 4 auf 3 ändert, nimmt die Ähnlichkeit um mehr als 20 ab (von 62,0036 auf 41,0474). Diese Ergebnisse legen nahe, dass 4 Cluster für die endgültige Partition ausreichen. Wenn Ihnen diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar.

Fusionierungsschritte

Schritt	Anzahl der Cluster	Ähnlichkeitsniveau	Distanzstufe	Zusammengefasste Cluster		Neuer Cluster	Anzahl der Beobachtungen in neuem Cluster
1	19	96,6005	0,16275	13	16	13	2
2	18	95,4642	0,21715	17	20	17	2
3	17	95,2648	0,22669	6	9	6	2
4	16	92,9178	0,33905	17	18	17	3
5	15	90,5296	0,45339	11	15	11	2
6	14	90,3124	0,46378	12	19	12	2
7	13	88,2431	0,56285	2	14	2	2
8	12	88,2431	0,56285	5	8	5	2
9	11	85,9744	0,67146	6	10	6	3
10	10	83,0639	0,81080	7	13	7	3
11	9	83,0639	0,81080	1	3	1	2
12	8	81,4039	0,89027	2	17	2	5
13	7	79,8185	0,96617	6	11	6	5
14	6	78,7534	1,01716	4	12	4	3
15	5	66,2112	1,61760	2	5	2	7
16	4	62,0036	1,81904	1	6	1	7
17	3	41,0474	2,82229	1	4	1	10
18	2	40,1718	2,86421	2	7	2	10
19	1	0,0000	4,78739	1	2	1	20

Tipp

Verwenden Sie das Dendrogramm, um die Ähnlichkeitsniveaus in jedem Schritt visuell zu beurteilen.

Distanzstufe

Die Distanz zwischen Clustern (unter Verwendung des ausgewählten agglomerativen Verfahrens) oder Variablen (unter Verwendung des ausgewählten Distanzmaßes), die in den einzelnen Schritten zusammengefasst werden. Minitab berechnet die Distanzstufe auf der Grundlage des agglomerativen Verfahrens und des Distanzmaßes, die Sie im Hauptdialogfeld ausgewählt haben.

Interpretation

Verwenden Sie die Distanzstufe für die Cluster, die in den einzelnen Schritten zusammengeführt werden, um die endgültigen Gruppierungen für die Daten zu bestimmen. Suchen Sie nach abrupten Veränderungen der Distanzstufe zwischen den Schritten. Der Schritt, der der abrupten Veränderung der Distanz vorangeht, stellt möglicherweise einen guten Schnittpunkt für die endgültige Partition dar. Für die endgültige Partition sollten die Cluster eine angemessen kleine Distanzstufe aufweisen. Sie sollten auch Ihr Praxiswissen über die Daten anwenden, um die endgültigen Gruppierungen zu bestimmen, die für Ihre Anwendung am sinnvollsten sind.

Die folgende Fusionierungstabelle zeigt beispielsweise, dass die Distanzstufe in den ersten 15 Schritten jeweils um 0,6 oder weniger ansteigt. Zwischen Schritt 16 und 17, wo sich die Anzahl der Cluster von 4 auf 3 ändert, steigt die Distanzstufe jedoch um mehr als 1 an (von 1,81904 auf 2,82229). Diese Ergebnisse legen nahe, dass möglicherweise 4 Cluster für die endgültige Partition ausreichen. Wenn Ihnen diese Gruppierung intuitiv geeignet erscheint, stellt sie vermutlich eine gute Wahl dar.

Fusionierungsschritte

Schritt	Anzahl der Cluster	Ähnlichkeitsniveau	Distanzstufe	Zusammengefasste Cluster		Neuer Cluster	Anzahl der Beobachtungen in neuem Cluster
1	19	96,6005	0,16275	13	16	13	2
2	18	95,4642	0,21715	17	20	17	2
3	17	95,2648	0,22669	6	9	6	2
4	16	92,9178	0,33905	17	18	17	3
5	15	90,5296	0,45339	11	15	11	2
6	14	90,3124	0,46378	12	19	12	2
7	13	88,2431	0,56285	2	14	2	2
8	12	88,2431	0,56285	5	8	5	2
9	11	85,9744	0,67146	6	10	6	3
10	10	83,0639	0,81080	7	13	7	3
11	9	83,0639	0,81080	1	3	1	2
12	8	81,4039	0,89027	2	17	2	5
13	7	79,8185	0,96617	6	11	6	5
14	6	78,7534	1,01716	4	12	4	3
15	5	66,2112	1,61760	2	5	2	7
16	4	62,0036	1,81904	1	6	1	7
17	3	41,0474	2,82229	1	4	1	10
18	2	40,1718	2,86421	2	7	2	10
19	1	0,0000	4,78739	1	2	1	20

Zusammengefasste Cluster

Die beiden Cluster, die in jedem Schritt des Fusionierungsprozesses zusammengefasst werden, um einen neuen Cluster zu bilden.

Neuer Cluster

Die Identifikationsnummer des neuen Clusters, der in jedem Schritt des Fusionierungsprozesses gebildet wird. Die Identifikationsnummer des neuen Clusters ist immer die kleinere der beiden Identifikationsnummern der zwei zusammengefassten Cluster. Wenn z. B. Cluster 2 und Cluster 9 zusammengefasst werden, wird der neu entstandene Cluster als Cluster 2 bezeichnet.

Anzahl der Beobachtungen im neuen Cluster

Die Anzahl der Beobachtungen in jedem neuen Cluster, der in jedem Schritt des Fusionierungsprozesses gebildet wird. Im letzten Schritt werden alle Beobachtungen in einem einzigen Cluster kombiniert. Daher entspricht die Anzahl der Beobachtungen im neuen Cluster für den letzten Schritt der Gesamtzahl der Beobachtungen in den Daten.

Hinweis

Für Clustervariablen entspricht die Anzahl der Beobachtungen der Anzahl der Variablen im neuen Cluster.