Überlegungen zu Daten für Diskriminanzanalyse

Befolgen Sie beim Erfassen von Daten, Durchführen der Analyse und Interpretieren der Ergebnisse die folgenden Richtlinien, um sicherzustellen, dass die Ergebnisse gültig sind.

Die Prädiktorvariablen sollten quantitativ sein
Für jeden Prädiktor muss eine eine numerische Spalte mit Messdaten vorhanden sein. Minitab verwendet diese Daten, um die Beziehung zwischen der Prädiktor- und der Antwortvariablen zu definieren. Wenn Ihnen ein kategorialer Prädiktor vorliegt, können Sie diese Analyse nicht verwenden. Verwenden Sie stattdessen die logistische Regression.
Die Prädiktoren sollten nicht stark korrelieren
Eine Korrelation zwischen den Prädiktoren wird als Multikollinearität bezeichnet. Bei starker Multikollinearität, oder wenn ein oder mehrere Prädiktoren im Wesentlichen konstant sind, kann Minitab die Diskriminanzanalyse nicht durchführen und zeigt eine Meldung an.
Die Antwortvariable sollte die Gruppe angeben
Es sollte genau eine Gruppierungsspalte vorhanden sein, die Bezeichner für bis zu 20 Gruppen enthält. Der Gruppenbezeichner kann aus numerischen Daten, Textdaten oder Datums-/Uhrzeitdaten bestehen.
Die Daten für die Prädiktorvariablen sollten in allen Gruppen normalverteilt sein
Für die Diskriminanzanalyse wird formal eine multivariate Normalverteilung angenommen. Die lineare Diskriminanzfunktion ist hinreichend robust gegenüber Abweichungen von der Normalverteilung, die quadratische Diskriminanzfunktion ist gegenüber der angenommenen Normalverteilung jedoch empfindlicher. Wenn Ihre Prädiktoren nicht normalverteilt sind, ziehen Sie die Verwendung der logistischen Regression in Betracht. Die logistische Regression liefert in solchen Fällen präzisere Ergebnisse.
Geben Sie möglichst A-priori-Wahrscheinlichkeiten für die Analyse ein
In manchen Fällen kennen Sie die Wahrscheinlichkeit, mit der eine Beobachtung in eine Gruppe gehört, bereits vor der Durchführung einer Diskriminanzanalyse. Wenn Sie z. B. die Käufer eines bestimmten Autos klassifizieren, wissen Sie vielleicht bereits, dass 60 % der Käufer männlich und 40 % weiblich sind. Wenn Sie A-priori-Wahrscheinlichkeiten kennen oder schätzen können, geben Sie diese für die Analyse an, um präzisere Ergebnisse zu erhalten.