Geben Sie im Feld Variablen oder Distanzmatrix entweder die Spalten ein, die die Messdaten enthalten, oder geben Sie eine gespeicherte Distanzmatrix ein, die die Distanzen zwischen allen Variablenpaaren enthält.
Wenn Sie eine gespeicherte Distanzmatrix eingeben, kann Minitab die Statistiken für die endgültige Partition nicht berechnen.
Für Messdaten müssen Sie über mindestens zwei numerische Spalten verfügen, und jede Spalte muss eine andere Messgröße darstellen. Löschen Sie Zeilen mit fehlenden Daten aus dem Arbeitsblatt, bevor Sie diese Analyse verwenden. Wenn zu viele Zeilen mit Daten vorhanden sind, empfiehlt es sich möglicherweise, eine Teilmenge des Arbeitsblatts zu bilden, bei der Zeilen mit fehlenden Daten ausgeschlossen werden. Weitere Informationen finden Sie unter Übersicht über „Teilmenge des Arbeitsblatts bilden“.
Sie können für diese Analyse keine kategoriale Variable eingeben. Wenn eine kategoriale Variable vorliegt, müssen Sie zuerst die Textwerte in eine numerische Skala konvertieren oder für jede Stufe der kategorialen Variablen eine separate Analyse durchführen. Weitere Informationen finden Sie unter Überlegungen zu Daten für Clustervariablen.
Für die gespeicherte Distanzmatrix entspricht der Eintrag in Zeile i und Spalte j der Distanzmatrix D der Distanz zwischen den Variablen i und j. Informationen zum Erstellen und Verwenden von gespeicherten Matrizen in Minitab finden Sie unter Übersicht über Matrizen.
C1 | C2 | C3 | C4 | C5 |
---|---|---|---|---|
Zeitung | Radio | Fernsehgeräte | Alphabetisierungsrate | Universität |
279 | 267 | 227 | 0,98 | 1 |
143 | 112 | 332 | 0,94 | 1 |
9 | 113 | 7 | 0,25 | 0 |
391 | 314 | 566 | 0,99 | 1 |
112 | 48 | 423 | 0,82 | 1 |
67 | 66 | 134 | 0,45 | 0 |
Wählen Sie unter Agglomeratives Verfahren ein Verfahren aus, um anzugeben, wie die Distanz zwischen zwei Clustern definiert wird. Sie können verschiedene agglomerative Verfahren ausprobieren, um herauszufinden, welches Verfahren für Ihre Daten die nützlichsten Ergebnisse liefert.
Bei Clusterbeobachtungen bezieht sich die Distanz auf die Distanz zwischen Beobachtungen, und die Kopplung bezieht sich auf die Distanz zwischen den Clustern von Beobachtungen. Bei Clustervariablen bezieht sich die Distanz auf die Distanz zwischen Variablen, und die Kopplung bezieht sich auf die Distanz zwischen den Clustern von Variablen.
Um optimale Ergebnisse zu erzielen, sollten Sie bei den Kriterien flexibel sein. Wenn Sie z. B. die endgültige Partition über die Anzahl der Cluster definieren, sollten Sie auch Änderungen des Ähnlichkeitsniveaus in Betracht ziehen. Ein steiler Abfall des Ähnlichkeitsniveaus beim Hinzufügen eines bestimmten Clusters kann ein Grund dafür sein, die endgültige Partition vor dieser Gruppierung festzulegen. Wenn Sie andersherum die endgültige Partition über das Ähnlichkeitsniveau definieren, stellen Sie möglicherweise fest, dass sich die Ähnlichkeitsniveaus über einen Bereich von Clustern kaum ändern, so dass Sie sich aus Gründen der Übersichtlichkeit für den Schritt mit der geringsten Clusteranzahl entscheiden.
Wenn Sie nicht wissen, welchen Wert Sie zum Festlegen der endgültigen Partition eingeben sollen, führen Sie die Analyse zuerst mit der Standardeinstellung durch (1 Cluster in der endgültigen Partition). Minitab zeigt die Ergebnisse für alle möglichen Clusteranzahlen an. Bestimmen Sie anhand der Ergebnisse einen Wert, den Sie für die endgültige Partition eingeben können. Wiederholen Sie dann die Analyse, und geben Sie die von Ihnen ermittelte endgültige Partition ein. Weitere Informationen finden Sie unter Bestimmen der endgültigen Gruppierung von Clustern.
Wählen Sie diese Option aus, damit in einem Baumdiagramm veranschaulicht wird, wie die Cluster in den einzelnen Schritten des Fusionierungsprozesses gebildet wurden. Im Dendrogramm können Sie die Ähnlichkeitswerte (oder Distanzwerte) für die Cluster in jedem Schritt anzeigen.
Um die standardmäßige Darstellung des Dendrogramms zu ändern, klicken Sie auf Anpassen.