Distance et fonctions discriminantes pour la fonction Analyse discriminante

Distance quadratique

Distance quadratique de Mahalanobis - Formule générale

La distance quadratique (également appelée la distance de Mahalanobis) entre l'observation x et le centre (moyenne) du groupe t pour la fonction discriminante linéaire est donnée par la formule générale suivante :

Distance quadratique de Mahalanobis - Fonction quadratique

La distance quadratique de Mahalanobis séparant x du groupe t pour la fonction discriminante quadratique est calculée comme suit :

Distance quadratique généralisée - Fonction linéaire

La distance quadratique généralisée séparant x du groupe t pour la fonction discriminante linéaire est calculée comme suit :

Distance quadratique généralisée - Fonction quadratique

La distance quadratique généralisée séparant x du groupe t pour la fonction discriminante quadratique est calculée comme suit :

Probabilité a posteriori

La probabilité a posteriori pour x appartenant au groupe t se calcule comme suit :

Scores discriminants linéaires

Les scores discriminants linéaires sont calculés comme suit :

Notation

TermeDescription
xvecteur de colonne de longueur p contenant les valeurs des prédicteurs pour cette observation (ce vecteur de colonne est stocké en tant que ligne)
pnombre de prédicteurs
n nombre total d'observations
tindice de groupe
ntnombre d'observations dans le groupe t
qtprobabilité a priori du groupe t, égale à nt/n
Spmatrice de covariance groupée de l'analyse discriminante linéaire
Simatrice de covariance du groupe i de l'analyse discriminante quadratique
mtvecteur de colonne de longueur p contenant les moyennes des prédicteurs calculées à partir des données du groupe t
Stmatrice de covariance du groupe t
|St|déterminant de St

Fonction discriminante linéaire

La fonction discriminante linéaire correspond aux coefficients de régressions multiples. Elle est calculée comme suit :

Pour une valeur x donnée, cette règle affecte x au groupe ayant la plus grande fonction discriminante linéaire.

Notation

TermeDescription
xvecteur de colonne de longueur p contenant les valeurs des prédicteurs pour cette observation (ce vecteur de colonne est stocké en tant que ligne)
 mivecteur de colonne de longueur p contenant les moyennes des prédicteurs calculées à partir des données du groupe i
Spmatrice de covariance groupée
ln pilogarithme népérien de la probabilité a priori du groupe i

Distance quadratique généralisée

La distance quadratique généralisée est utilisée en tant que mesure de la distance quadratique ; elle est calculée comme suit :

Notation

TermeDescription
xvecteur de colonne de longueur p contenant les valeurs des prédicteurs pour cette observation (ce vecteur de colonne est stocké en tant que ligne)
 mivecteur de colonne de longueur p contenant les moyennes des prédicteurs calculées à partir des données du groupe i
Spmatrice de covariance groupée f
ln pilogarithme népérien de la probabilité a priori du groupe i

Probabilité a posteriori

La probabilité a posteriori est la probabilité du groupe i d'après les données ; elle se calcule comme suit :

La probabilité a posteriori la plus grande est équivalente à la plus grande valeur de ln [pi fi (x)]

où (si la loi est normale) :
et

Notation

TermeDescription
piprobabilité a priori du groupe i
fi(x)densité jointe pour les données du groupe i (les paramètres de population étant remplacés par les estimations de l'échantillon)
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique