Distanz- und Diskriminanzfunktionen für Diskriminanzanalyse

Quadrierte Distanz

Quadrierte Mahalanobis-Distanz – Allgemeine Form

Die quadrierte Distanz (auch als Mahalanobis-Distanz bezeichnet) zwischen Beobachtung x und dem Zentrum (Mittelwert) von Gruppe t für die lineare Diskriminanzfunktion wird durch folgende allgemeine Form angegeben:

Quadrierte Mahalanobis-Distanz – Quadratische Funktion

Die quadrierte Mahalanobis-Distanz zwischen x und der Gruppe t für die quadratische Diskriminanzfunktion wird wie folgt berechnet:

Verallgemeinerte quadrierte Distanz – Lineare Funktion

Die verallgemeinerte quadrierte Distanz zwischen x und der Gruppe t für die lineare Diskriminanzfunktion wird wie folgt berechnet:

Verallgemeinerte quadrierte Distanz – Quadratische Funktion

Die verallgemeinerte quadrierte Distanz zwischen x und der Gruppe t für die quadratische Diskriminanzfunktion wird wie folgt berechnet:

A-posteriori-Wahrscheinlichkeit

Die A-posteriori-Wahrscheinlichkeit, dass x zu Gruppe t gehört, wird wie folgt berechnet:

Lineare Diskriminanzwerte

Die linearen Diskriminanzwerte werden wie folgt berechnet:

Notation

BegriffBeschreibung
xSpaltenvektor der Länge p, der die Werte des Prädiktors für diese Beobachtung enthält. (Dieser Spaltenvektor wird als eine Zeile gespeichert.)
pAnzahl der Prädiktoren
nGesamtzahl der Beobachtungen
tGruppenindex
ntAnzahl der Beobachtungen in Gruppe t
qtA-priori-Wahrscheinlichkeit für Gruppe t, die nt/n entspricht
Spzusammengefasste Kovarianzmatrix für die lineare Diskriminanzanalyse
Si Kovarianzmatrix von Gruppe i für die quadratische Diskriminanzanalyse
mtSpaltenvektor der Länge p, der die Mittelwerte der Prädiktoren enthält, die aus den Daten in Gruppe t berechnet werden
StKovarianzmatrix für Gruppe t
|St|Determinante von St

Lineare Diskriminanzfunktion

Die lineare Diskriminanzfunktion entspricht den Regressionskoeffizienten der multiplen Regression und wird wie folgt berechnet:

Für ein gegebenes x ordnet diese Regel x der Gruppe mit dem größten Wert der linearen Diskriminanzfunktion zu.

Notation

BegriffBeschreibung
xSpaltenvektor der Länge p, der die Werte des Prädiktors für diese Beobachtung enthält. (Dieser Spaltenvektor wird als eine Zeile gespeichert.)
miSpaltenvektor der Länge p, der die Mittelwerte der Prädiktoren enthält, die aus den Daten in Gruppe i berechnet werden
Spzusammengefasste Kovarianzmatrix
ln pinatürlicher Logarithmus der A-priori-Wahrscheinlichkeit für Gruppe i

Verallgemeinerte quadrierte Distanz

Die verallgemeinerte quadrierte Distanz dient als Maß für die quadratische Distanz und wird wie folgt berechnet:

Notation

BegriffBeschreibung
xSpaltenvektor der Länge p, der die Werte des Prädiktors für diese Beobachtung enthält. (Dieser Spaltenvektor wird als eine Zeile gespeichert.)
miSpaltenvektor der Länge p, der die Mittelwerte der Prädiktoren enthält, die aus den Daten in Gruppe i berechnet werden
Spzusammengefasste Kovarianzmatrix f
ln pinatürlicher Logarithmus der A-priori-Wahrscheinlichkeit für Gruppe i

A-posteriori-Wahrscheinlichkeit

Die A-posteriori-Wahrscheinlichkeit ist die Wahrscheinlichkeit von Gruppe i bei den angegebenen Daten und wird wie folgt berechnet:

Die größte A-posteriori-Wahrscheinlichkeit entspricht dem höchsten Wert von ln [pi fi (x)]

wobei (sofern es sich um eine Normalverteilung handelt):
und

Notation

BegriffBeschreibung
piA-priori-Wahrscheinlichkeit für Gruppe i
fi(x)gemeinsame Dichte für die Daten in der Gruppe i (wobei die Parameter der Grundgesamtheit durch die Stichprobenschätzwerte ersetzt werden)