Contributions des colonnes pour la fonction Analyse des correspondances multiples

Coordonnées principales des colonnes

Les profils de colonnes se trouvent dans un espace de dimension d. L'ensemble complet de d axes principaux couvre cet espace. Supposons que gj1, gj2, gj3, ..., gjd sont les coordonnées du profil de colonne j relatives aux axes principaux. Ces coordonnées sont appelées coordonnées principales des colonnes. La k-ième coordonnée principale du profil de colonne j est gjk.

Le meilleur sous-espace de dimension k est couvert par les k premiers axes principaux. Si nous projetons le profil de colonne j sur le meilleur sous-espace de dimension k, gj1, ..., gjk sont les coordonnées principales des colonnes du profil dans ce sous-espace.

Corrélation

La corrélation entre le profil de colonne i et la composante principale k est calculée de la manière suivante :

Minitab calcule l'intertie relative de chaque colonne. L'inertie absolue est le produit de l'inertie relative et de l'inertie totale.

La somme des corrélations de la colonne j, sur toutes les composantes principales, est de 1. La somme sur les k premières coordonnées principales correspond à la qualité associée au profil de colonne j et au meilleur sous-espace de dimension k.

Notation

TermeDescription
gjk k-ième coordonnée principale du profil de colonne j

Inertie et inertie des cellules

L'inertie d'une cellule est calculée comme suit :

La somme des inerties individuelles des cellules est égale à l'inertie totale, parfois simplement appelée inertie, du tableau.

L'inertie relative d'une cellule est calculée comme suit :

Axes principaux (composantes principales)

Les profils de colonnes se trouvent dans un espace de dimension c. Les sous-espaces de dimension inférieurs sont couverts par les axes principaux, également appelés composantes principales. Le premier axe principal est choisi comme vecteur dans l'espace de dimension c qui constitue la plus grande part de l'inertie totale. Le premier axe principal couvre donc le meilleur sous-espace unidimensionnel (c'est-à-dire, le plus proche des profils avec une mesure appropriée). Le deuxième axe principal est choisi comme vecteur dans l'espace de dimension c qui constitue la plus grande part de l'inertie restante. Ainsi, les deux premiers axes principaux couvrent le meilleur sous-espace de dimension 2. Le troisième axe principal est choisi comme vecteur dans l'espace de dimension c qui constitue la plus grande part de l'inertie restante, après l'inertie représentée par les deux premiers axes principaux. Ainsi, les trois premiers axes principaux couvrent le meilleur sous-espace de dimension 3, et ainsi de suite.

Soit d = la valeur la plus petite entre (r − 1) et (c − 1). Les profils de colonnes se trouvent en fait dans un sous-espace de dimension d de l'espace de dimension c entier (équivalent à l'espace de dimension r entier). Ainsi, le nombre d'axes principaux est au maximum d.

Qualité

La qualité associée au profil de colonne j et au meilleur sous-espace de dimension k est calculée comme suit :

Cette qualité est toujours un nombre compris entre 0 et 1, une plus grande valeur correspondant à une meilleure approximation.

Notation

TermeDescription
gjk k-ième coordonnée principale du profil de colonne j

Contribution relative à l'inertie totale

La somme des inerties des cellules dans une colonne représente la contribution de la colonne à l'inertie totale. La contribution relative d'une colonne à l'inertie totale est calculée comme suit :

Contributions des colonnes

Chaque colonne contribue à l'inertie de chaque axe. La contribution de la colonne j à l'axe k, exprimée en pourcentage de l'inertie pour l'axe k, est calculée comme suit :

La somme des contributions pour l'axe principal k, sur toutes les colonnes j, est de 1.

Notation

TermeDescription
gjk k-ième coordonnée principale du profil de colonne j

Masses des colonnes

La masse de la colonne j est calculée comme suit :

Le vecteur des masses des c colonnes est identique au profil de colonne moyen.

Coordonnées normalisées

Les coordonnées normalisées de colonnes de la composante k sont égales aux coordonnées principales de la composante k divisées par la racine carrée de la k-ième inertie.