Überlegungen zu Daten für Clusterzentrenanalyse

Befolgen Sie beim Erfassen von Daten, Durchführen der Analyse und Interpretieren der Ergebnisse die folgenden Richtlinien, um sicherzustellen, dass die Ergebnisse gültig sind.

Sie müssen Rohdaten verwenden.
Jede Zeile enthält Messdaten für ein einziges Teil oder Prüfobjekt. Sie müssen über zwei oder mehr numerische Spalten verfügen. Jede Spalte stellt dabei eine andere Messung dar. Sie müssen Zeilen mit fehlenden Daten aus dem Arbeitsblatt löschen, bevor Sie diese Analyse verwenden.
Der Clustervorgang funktioniert am besten, wenn Sie bei den anfänglichen Clusterfestlegungen von Ihrem praktischen und/oder technischen Wissen über die Beobachtungen ausgehen.
Wenn Ihnen vorab jedoch keine Kenntnisse über die anfänglichen Cluster vorliegen, können Sie die Analyse durchführen, ohne den Prozess zu initialisieren, indem Sie nur die Anzahl der zu bildenden Cluster angeben. Weitere Informationen finden Sie unter Eingeben der Daten für Clusterzentrenanalyse.
Um den Clustervorgang mit Hilfe einer Datenspalte zu initialisieren, müssen Sie über eine Spalte mit Werten verfügen, die die Cluster-Zugehörigkeiten angeben.
Die Initialisierungsspalte muss positive, aufeinander folgende ganze Zahlen oder Nullen enthalten (sie sollte nicht nur Nullen enthalten). Zunächst wird jede Beobachtung dem Cluster zugewiesen, der durch den entsprechenden Wert in dieser Spalte angegeben wird. Eine Initialisierung von null bedeutet, dass eine Beobachtung zunächst keiner Gruppe zugewiesen ist. Die Anzahl von eindeutigen positiven ganzen Zahlen in der Spalte für die Anfangspartition entspricht der Anzahl der Cluster in der endgültigen Partition.
Ausreißer können die Ergebnisse Ihrer Analyse signifikant beeinflussen.
Das Vorhandensein von Ausreißern, d. h. ungewöhnlich hohen oder niedrigen Werten in den Daten, kann sich auf die Ergebnisse der Clusterbildung auswirken. Wenn die Ausreißer nicht entfernt werden, sind die Cluster oft größer, und die resultierende Lösung erscheint möglicherweise nicht logisch. Untersuchen Sie Ausreißer, und entfernen Sie alle Werte, die auf Mess- oder Aufzeichnungsfehler zurückgehen. Extreme Ausreißer können auch auf spezifische Beobachtungen hinweisen, die grundsätzlich von allen anderen Beobachtungen im Datensatz abweichen, möglicherweise aufgrund von Ausnahmebedingungen. Wenn praktische Gründe dafür vorliegen, extreme Ausreißer nicht in die Analyse einzubinden, ziehen Sie eine Wiederholung der Analyse ohne die Ausreißer in Betracht, um festzustellen, wie sie sich auf die Ergebnisse auswirken.
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien