Interpretieren aller Statistiken und Grafiken für Clusterzentrenanalyse

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken und Grafiken, die für die Clusterzentrenanalyse bereitgestellt werden.

Anzahl der Beobachtungen

Die Anzahl der Beobachtungen in den einzelnen Clustern der endgültigen Partition.

Interpretation

Untersuchen Sie die die Anzahl der Beobachtungen in den einzelnen Clustern, wenn Sie die Maße der Streuung interpretieren, z. B. die durchschnittliche Distanz und die Summe der Quadrate innerhalb der Cluster. Die Streuung in einem Cluster kann von der Anzahl der Beobachtungen im Cluster beeinflusst werden. Die Summe der Quadrate innerhalb des Clusters wird z. B. mit zunehmender Anzahl der Beobachtungen größer.

Untersuchen Sie Cluster, die signifikant weniger Beobachtungen als andere Cluster enthalten. Cluster mit sehr wenigen Beobachtungen können Ausreißer oder ungewöhnliche Beobachtungen mit singulären Merkmalen enthalten.

Summe der Quadrate innerhalb des Clusters

Die Summe der quadrierten Abweichungen von jeder Beobachtung und vom Cluster-Zentroiden.

Interpretation

Die Summe der Quadrate innerhalb des Clusters ist ein Maß für die Streuung der Beobachtungen innerhalb eines Clusters. Im Allgemeinen sind Cluster mit kleinen Summen der Quadrate kompakter als solche mit großen Summen der Quadrate. Cluster mit höheren Werten weisen eine größere Streuung der Beobachtungen innerhalb des Clusters auf.

Ähnlich wie die Summen und Mittel der Quadrat in der ANOVA wird die Summe der Quadrate innerhalb des Clusters jedoch von der Anzahl der Beobachtungen beeinflusst. Mit zunehmender Anzahl der Beobachtungen wird die Summe der Quadrate größer. Die Summen der Quadrate innerhalb des Clusters sind daher oft nicht direkt vergleichbar, wenn Cluster mit verschiedenen Anzahlen von Beobachtungen betrachtet werden. Um die Summen der Quadrate innerhalb des Clusters von verschiedenen Clustern zu vergleichen, verwenden Sie stattdessen die durchschnittliche Distanz vom Zentroiden.

Durchschnittliche Distanz von Zentroid

Der Durchschnitt der Distanzen zwischen den Beobachtungen und dem Zentroiden des jeweiligen Clusters.

Interpretation

Die durchschnittliche Distanz zwischen den Beobachtungen und dem Cluster-Zentroiden ist ein Maß für die Streuung der Beobachtungen innerhalb eines Clusters. In der Regel ist ein Cluster mit einer kleineren durchschnittlichen Distanz kompakter als ein Cluster mit einer größeren durchschnittlichen Distanz. Cluster mit höheren Werten weisen eine größere Streuung der Beobachtungen innerhalb des Clusters auf.

Maximale Distanz von Zentroid

Der Maximalwert der Distanzen zwischen den Beobachtungen und dem Zentroiden des jeweiligen Clusters.

Interpretation

Die maximale Distanz zwischen den Beobachtungen und dem Cluster-Zentroiden ist ein Maß für die Streuung der Beobachtungen innerhalb eines Clusters. Ein höherer Maximalwert, insbesondere im Vergleich zu der durchschnittlichen Distanz, weist auf eine Beobachtung im Cluster hin, die weiter entfernt vom Cluster-Zentroiden liegt.

Cluster-Zentroid

Die Mitte eines Clusters. Ein Zentroid ist ein Vektor, der für jede Variable eine Zahl enthält, wobei die einzelnen Zahlen durch den Mittelwert einer Variablen für die Beobachtungen in dem betreffenden Cluster gebildet werden. Sie können sich den Zentroiden als mehrdimensionalen Durchschnitt des Clusters vorstellen.

Interpretation

Verwenden Sie den Cluster-Zentroiden als allgemeines Maß für die Lage von Clustern und zum Interpretieren der einzelnen Cluster. Jeder Zentroid kann als Darstellung der „durchschnittlichen Beobachtung“ innerhalb eines Clusters über alle Variablen in der Analyse angesehen werden.

Minitab berechnet die Distanzen zwischen den Zentroiden der Cluster, die in der endgültigen Partition enthalten sind. Außerdem berechnet Minitab für jeden Cluster verschiedene Distanzmaße zwischen dem Cluster-Zentroiden und den Beobachtungen im Cluster. Weitere Informationen finden Sie in den Themen zu den einzelnen Distanzmaßen.

Gesamtzentroid

Der Gesamtzentroid ist ein Vektor von Mittelwerten der Variablen für alle Beobachtungen.

Distanzen zwischen Cluster-Zentroiden

Die Distanzen zwischen den Cluster-Zentroiden geben an, wie weit die Zentroiden der Cluster in der endgültigen Partition voneinander entfernt sind.

Interpretation

Obwohl die Distanzwerte an sich nicht sehr informativ sind, können Sie die Distanzen vergleichen, um die Unterschiede zwischen den Clustern zu ermitteln. Größere Distanzen weisen in der Regel auf größere Unterschiede zwischen den Clustern hin.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien