Distance et fonctions discriminantes pour la fonction Analyse discriminante

Distance quadratique

Distance quadratique de Mahalanobis - Formule générale

La distance quadratique (également appelée la distance de Mahalanobis) entre l'observation x et le centre (moyenne) du groupe t pour la fonction discriminante linéaire est donnée par la formule générale suivante :

Distance quadratique de Mahalanobis - Fonction quadratique

La distance quadratique de Mahalanobis séparant x du groupe t pour la fonction discriminante quadratique est calculée comme suit :

Distance quadratique généralisée - Fonction linéaire

La distance quadratique généralisée séparant x du groupe t pour la fonction discriminante linéaire est calculée comme suit :

Distance quadratique généralisée - Fonction quadratique

La distance quadratique généralisée séparant x du groupe t pour la fonction discriminante quadratique est calculée comme suit :

Probabilité a posteriori

La probabilité a posteriori pour x appartenant au groupe t se calcule comme suit :

Scores discriminants linéaires

Les scores discriminants linéaires sont calculés comme suit :

Notation

TermeDescription
xvecteur de colonne de longueur p contenant les valeurs des prédicteurs pour cette observation (ce vecteur de colonne est stocké en tant que ligne)
pnombre de prédicteurs
nnombre total d'observations
tindice de groupe
ntnombre d'observations dans le groupe t
qtprobabilité a priori du groupe t, égale à nt/n
Spmatrice de covariance groupée de l'analyse discriminante linéaire
Si matrice de covariance du groupe i de l'analyse discriminante quadratique
mtvecteur de colonne de longueur p contenant les moyennes des prédicteurs calculées à partir des données du groupe t
Stmatrice de covariance du groupe t
|St|déterminant de St

Fonction discriminante linéaire

La fonction discriminante linéaire correspond aux coefficients de régressions multiples. Elle est calculée comme suit :

Pour une valeur x donnée, cette règle affecte x au groupe ayant la plus grande fonction discriminante linéaire.

Notation

TermeDescription
xvecteur de colonne de longueur p contenant les valeurs des prédicteurs pour cette observation (ce vecteur de colonne est stocké en tant que ligne)
 mivecteur de colonne de longueur p contenant les moyennes des prédicteurs calculées à partir des données du groupe i
Spmatrice de covariance groupée
ln pilogarithme népérien de la probabilité a priori du groupe i

Distance quadratique généralisée

La distance quadratique généralisée est utilisée en tant que mesure de la distance quadratique ; elle est calculée comme suit :

Notation

TermeDescription
xvecteur de colonne de longueur p contenant les valeurs des prédicteurs pour cette observation (ce vecteur de colonne est stocké en tant que ligne)
 mivecteur de colonne de longueur p contenant les moyennes des prédicteurs calculées à partir des données du groupe i
Spmatrice de covariance groupée f
ln pilogarithme népérien de la probabilité a priori du groupe i

Probabilité a posteriori

La probabilité a posteriori est la probabilité du groupe i d'après les données ; elle se calcule comme suit :

La probabilité a posteriori la plus grande est équivalente à la plus grande valeur de ln [pi fi (x)]

où (si la loi est normale) :
et

Notation

TermeDescription
piprobabilité a priori du groupe i
fi(x)densité jointe pour les données du groupe i (les paramètres de population étant remplacés par les estimations de l'échantillon)