Interprétation de toutes les statistiques et de tous les graphiques pour la fonction Analyse des correspondances multiples

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique et chaque graphique fournis avec l'analyse des correspondances multiples.

Axe

Minitab calcule chaque axe principal, également appelé composante principale. Minitab classe les composantes principales en fonction de leur contribution à l'inertie totale. La première composante principale (axe) représente la plus grande partie de l'inertie. La deuxième composante principale (axe) représente la plus grande partie de l'inertie restante, et ainsi de suite.

Interprétation

Utilisez les axes principaux pour évaluer les composantes qui représentent la plus grande partie de la variabilité des données.

Analyse de la matrice indicatrice Axe Inertie Proportion Cumulée Histogramme 1 0,4032 0,4032 0,4032 ****************************** 2 0,2520 0,2520 0,6552 ****************** 3 0,1899 0,1899 0,8451 ************** 4 0,1549 0,1549 1,0000 *********** Total 1,0000

Ces résultats indiquent la décomposition de l'inertie totale en 4 composantes. L'inertie totale expliquée par les quatre composantes est égale à 1,000. La première composante constitue 40,32 % de l'inertie totale et la deuxième composante, 25,20 %. Ensemble, ces deux composantes représentent 65,52 % de l'inertie totale. C'est pourquoi la spécification de 2 composantes pour l'analyse risque d'être insuffisante. L'ajout d'une troisième composante fait augmenter la proportion cumulée de l'inertie jusqu'à 84,51 %.

Inertie

L'inertie d'une composante décrit l'importance de la variation expliquée par la composante. L'inertie d'une colonne décrit combien les valeurs de cette catégorie diffèrent de la valeur attendue en partant de l'hypothèse que les variables de catégorie ne sont aucunement corrélées. Pour calculer l'inertie d'une composante, Minitab multiplie l'inertie de chaque catégorie par la corrélation de la catégorie pour cette composante, puis additionne les produits obtenus.

Interprétation

Utilisez l'inertie des composantes pour déterminer les composantes qui représentent la majeure partie de la variabilité dans les données.

Analyse de la matrice indicatrice Axe Inertie Proportion Cumulée Histogramme 1 0,4032 0,4032 0,4032 ****************************** 2 0,2520 0,2520 0,6552 ****************** 3 0,1899 0,1899 0,8451 ************** 4 0,1549 0,1549 1,0000 *********** Total 1,0000

Ces résultats indiquent la décomposition de l'inertie totale en 4 composantes. L'inertie totale expliquée par les quatre composantes est égale à 1,000. La première composante (axe) constitue 40,32 % de l'inertie totale et la deuxième composante, 25,20 %. Ensemble, ces deux composantes représentent 65,52 % de l'inertie totale. C'est pourquoi la spécification de 2 composantes pour l'analyse risque d'être insuffisante. L'ajout d'une troisième composante fait augmenter la proportion cumulée de l'inertie jusqu'à 84,51 %.

Utilisez l'inertie des colonnes pour déterminer les catégories les plus aberrantes en partant de l'hypothèse que les variables de catégorie ne sont aucunement corrélées. Pour les inerties des colonnes, les différences à partir de (1/nombre de catégories) indiquent les catégories les plus aberrantes.

Contributions des colonnes Composa Composante 1 2 ID Nom Qual. Masse Inerte Coord Corr Contrib Coord 1 Petit 0,9655 0,0424 0,2076 0,3814 0,0297 0,0153 -2,1394 2 Normal 0,9655 0,2076 0,0424 -0,0780 0,0297 0,0031 0,4374 3 PasEjection 0,4739 0,2134 0,0366 -0,2844 0,4717 0,0428 -0,0197 4 Ejection 0,4739 0,0366 0,2134 1,6587 0,4717 0,2497 0,1151 5 Collision 0,6133 0,1926 0,0574 -0,4264 0,6095 0,0868 0,0338 6 Tonneau 0,6133 0,0574 0,1926 1,4294 0,6095 0,2911 -0,1133 7 PasGrave 0,5680 0,1353 0,1147 -0,6523 0,5018 0,1428 -0,2371 8 Grave 0,5680 0,1147 0,1353 0,7692 0,5018 0,1684 0,2795

Dans le tableau Contributions des colonnes, la colonne étiquetée Inerte est la proportion de la contribution de chaque catégorie à l'inertie totale. Ainsi, Ejection s'écarte le plus de sa valeur attendue et contribue pour 21,3 % à la statistique totale du Khi deux.

Proportion, proportion cumulée et histogramme

La proportion indique la proportion de l'inertie totale (inertie expliquée par toutes les composantes) qui est expliquée par chaque composante principale (axe). Minitab affiche les composantes dans l'ordre de leur proportion, de la plus élevée à la plus faible. Chaque proportion est représentée visuellement dans l'histogramme.

La proportion cumulée indique la somme cumulée des proportions au fur et à mesure de l'ajout des composantes (axes).

Interprétation

Utilisez la proportion et la proportion cumulée pour déterminer le nombre de composantes suffisant à expliquer la plus grande part de l'inertie totale. Dans l'idéal, deux ou trois composantes représentent la majeure partie de l'inertie totale et sont plus importantes que les autres composantes.

Analyse de la matrice indicatrice Axe Inertie Proportion Cumulée Histogramme 1 0,4032 0,4032 0,4032 ****************************** 2 0,2520 0,2520 0,6552 ****************** 3 0,1899 0,1899 0,8451 ************** 4 0,1549 0,1549 1,0000 *********** Total 1,0000

Ces résultats indiquent la décomposition de l'inertie totale en 4 composantes. L'inertie totale expliquée par les quatre composantes est égale à 1,000. La première composante (axe) constitue 40,32 % de l'inertie totale et la deuxième composante, 25,20 %. Ensemble, ces deux composantes représentent 65,52 % de l'inertie totale. C'est pourquoi la spécification de 2 composantes pour l'analyse risque d'être insuffisante. L'ajout d'une troisième composante fait augmenter la proportion cumulée de l'inertie jusqu'à 84,51 %.

Qual.

La qualité (Qual.) est la distance quadratique du point à partir de l'origine du nombre de dimensions choisi divisé par la distance quadratique à partir de l'origine de l'espace défini par le nombre maximal de dimensions. Minitab calcule une valeur de qualité pour chaque catégorie.

Interprétation

Utilisez les valeurs de qualité pour déterminer la proportion de l'inertie représentée par les composantes de chaque catégorie. La qualité est toujours un nombre compris entre 0 et 1. Lorsque les valeurs de qualité sont élevées, la catégorie est fortement représentée par les composantes. De faibles valeurs indiquent une plus faible représentation. Les valeurs de qualité vous aident à interpréter les composantes.

Utilisez les valeurs de contribution des colonnes pour déterminer les catégories qui contribuent le plus à l'inertie de chaque composante.

Contributions des colonnes Composa Composante 1 2 ID Nom Qual. Masse Inerte Coord Corr Contrib Coord 1 Petit 0,9655 0,0424 0,2076 0,3814 0,0297 0,0153 -2,1394 2 Normal 0,9655 0,2076 0,0424 -0,0780 0,0297 0,0031 0,4374 3 PasEjection 0,4739 0,2134 0,0366 -0,2844 0,4717 0,0428 -0,0197 4 Ejection 0,4739 0,0366 0,2134 1,6587 0,4717 0,2497 0,1151 5 Collision 0,6133 0,1926 0,0574 -0,4264 0,6095 0,0868 0,0338 6 Tonneau 0,6133 0,0574 0,1926 1,4294 0,6095 0,2911 -0,1133 7 PasGrave 0,5680 0,1353 0,1147 -0,6523 0,5018 0,1428 -0,2371 8 Grave 0,5680 0,1147 0,1353 0,7692 0,5018 0,1684 0,2795

Dans cette analyse, Minitab calcule deux composantes principales pour les données liées aux accidents automobiles. Dans le tableau Contributions des colonnes, les valeurs de qualité les plus élevées relèvent des tailles Petit (0,965) et Normal (0,965). Ces deux catégories sont donc les mieux représentées par les deux composantes. La représentation de l'éjection du conducteur est la moins bonne, avec une valeur de qualité de 0,474 pour Ejection et PasEjection. Tonneau (0,291) et Ejection (0,250) contribuent le plus à l'inertie de la composante 1. Les tailles de véhicules Petit (0,771) et Normal (0,158) contribuent le plus à l'inertie de la composante 2. Toutefois, ces résultats doivent être interprétés avec prudence, car il se peut que deux composantes ne suffisent pas à expliquer correctement la variabilité de ces données.

Masse

La masse est le total de la matrice des effectifs relatifs pour chaque catégorie. La masse d'une colonne est la somme de tous les effectifs de la colonne divisée par la somme de tous les effectifs.

Interprétation

Utilisez la masse pour déterminer la proportion de chaque catégorie de colonne. Plus les valeurs des masses sont élevées, plus l'effectif relatif d'une catégorie de colonne est élevé. La masse totale de toutes les catégories de colonnes est égale à 1 (100 %).

Contributions des colonnes Composa Composante 1 2 ID Nom Qual. Masse Inerte Coord Corr Contrib Coord 1 Petit 0,9655 0,0424 0,2076 0,3814 0,0297 0,0153 -2,1394 2 Normal 0,9655 0,2076 0,0424 -0,0780 0,0297 0,0031 0,4374 3 PasEjection 0,4739 0,2134 0,0366 -0,2844 0,4717 0,0428 -0,0197 4 Ejection 0,4739 0,0366 0,2134 1,6587 0,4717 0,2497 0,1151 5 Collision 0,6133 0,1926 0,0574 -0,4264 0,6095 0,0868 0,0338 6 Tonneau 0,6133 0,0574 0,1926 1,4294 0,6095 0,2911 -0,1133 7 PasGrave 0,5680 0,1353 0,1147 -0,6523 0,5018 0,1428 -0,2371 8 Grave 0,5680 0,1147 0,1353 0,7692 0,5018 0,1684 0,2795

Ce tableau Contributions des colonnes évalue les catégories de colonnes associées aux accidents automobiles. La catégorie PasEjection présente la masse la plus élevée (0,213) et constitue 21,3 % des données. La catégorie Ejection a la masse la moins élevée (0,037) et constitue 3,7 % des données. Ainsi, pour ces données, les accidents lors desquels le conducteur est éjecté sont relativement rares, tandis que les accidents sans éjection sont plus courants.

Coord

Minitab calcule les coordonnées principales de colonnes (Coord) pour chaque composante. Les coordonnées principales de colonnes sont les coordonnées affichées sur le diagramme à colonnes.

Pour représenter visuellement les points définis par les coordonnées principales de colonnes, utilisez le diagramme à colonnes.

Corr

La valeur de corrélation de colonne représente la contribution de la composante à l'inertie de la colonne. Les valeurs de corrélation s'étendent de 0 à 1.

Interprétation

Utilisez la valeur de corrélation pour interpréter chaque composante en fonction de leur contribution à l'inertie de colonne. Les valeurs proches de 1 indiquent que la composante représente une grande partie de l'inertie. Les valeurs proches de 0 indiquent que la composante contribue peu à l'inertie.

Contributions des colonnes Composa Composante 1 2 ID Nom Qual. Masse Inerte Coord Corr Contrib Coord 1 Petit 0,9655 0,0424 0,2076 0,3814 0,0297 0,0153 -2,1394 2 Normal 0,9655 0,2076 0,0424 -0,0780 0,0297 0,0031 0,4374 3 PasEjection 0,4739 0,2134 0,0366 -0,2844 0,4717 0,0428 -0,0197 4 Ejection 0,4739 0,0366 0,2134 1,6587 0,4717 0,2497 0,1151 5 Collision 0,6133 0,1926 0,0574 -0,4264 0,6095 0,0868 0,0338 6 Tonneau 0,6133 0,0574 0,1926 1,4294 0,6095 0,2911 -0,1133 7 PasGrave 0,5680 0,1353 0,1147 -0,6523 0,5018 0,1428 -0,2371 8 Grave 0,5680 0,1147 0,1353 0,7692 0,5018 0,1684 0,2795

Ce tableau Contributions des colonnes évalue les catégories de colonnes associées aux accidents automobiles. La composante 1 contribue pour la plus grande part à l'inertie du type d'accident (Corr = 0,610 pour Collision et Tonneau), mais explique peu l'inertie de la taille du véhicule (Corr = 0,030 pour Petit et Normal).

Contrib

Contribution (Contrib) de chaque catégorie de colonne à l'inertie de chaque composante.

Interprétation

Utilisez les valeurs de contribution des catégories de colonnes afin d'interpréter les composantes.

Contributions des colonnes Composa Composante 1 2 ID Nom Qual. Masse Inerte Coord Corr Contrib Coord 1 Petit 0,9655 0,0424 0,2076 0,3814 0,0297 0,0153 -2,1394 2 Normal 0,9655 0,2076 0,0424 -0,0780 0,0297 0,0031 0,4374 3 PasEjection 0,4739 0,2134 0,0366 -0,2844 0,4717 0,0428 -0,0197 4 Ejection 0,4739 0,0366 0,2134 1,6587 0,4717 0,2497 0,1151 5 Collision 0,6133 0,1926 0,0574 -0,4264 0,6095 0,0868 0,0338 6 Tonneau 0,6133 0,0574 0,1926 1,4294 0,6095 0,2911 -0,1133 7 PasGrave 0,5680 0,1353 0,1147 -0,6523 0,5018 0,1428 -0,2371 8 Grave 0,5680 0,1147 0,1353 0,7692 0,5018 0,1684 0,2795

Ce tableau Contributions des colonnes évalue les catégories de colonnes associées aux accidents automobiles. Ejection (Contrib = 0250) et Tonneau (Contrib = 0,291) contribuent le plus à l'inertie de la composante 1. Les tailles Petit (Contrib = 0,771) et Normal (Contrib = 0,158) contribuent le plus à l'inertie de la composante 2.

Diagramme à colonnes

Le diagramme à colonnes indique les coordonnées principales des catégories de colonnes. Minitab représente les points des colonnes par un carré bleu - plein pour les points normaux et simple pour les points supplémentaires.
Remarque

Par défaut, Minitab affiche les points relatifs aux deux premières composantes principales, ce qui représente la plus grande partie de l'inertie totale. Pour afficher d'autres composantes principales (axes) sur le diagramme, cliquez sur Graphiques et saisissez le nombre de composantes lorsque vous effectuez l'analyse.

Interprétation

Utilisez le diagramme à colonnes pour rechercher des relations entre les catégories de colonnes et pour interpréter les composantes principales par rapport aux catégories de colonnes. Plus les points sont éloignés de l'origine, plus les catégories sont influentes. Si des points sont situés à des extrémités opposées du diagramme, cela signifie qu'une composante présente le contraste entre ces catégories.

Dans ce diagramme à colonnes, Ejection et Tonneau sont les plus éloignés de l'origine le long de l'axe horizontal pour la composante 1. Cela correspond à la contribution relativement élevée (Contrib) de ces catégories à la composante 1. Etant donné que Ejection et PasEjection, de même que Grave et PasGrave, se situent à des extrémités opposées par rapport à l'origine, la composante 1 montre le contraste entre ces valeurs de catégories. La composante 2 est affichée sur l'axe vertical. La taille de véhicule Petit est éloignée des autres catégories d'un côté de l'axe vertical. Cela signifie que la composante 2 montre le contraste entre la taille Petit et les autres catégories.

Tableau des variables indicatrices

Le tableau des variables indicatrices affiche toutes les observations de vos données sous forme de variables indicatrices. Chaque variable indicatrice (colonne) représente un niveau de la variable de catégorie et chaque observation (ligne) prend une valeur binaire, selon qu'elle appartient (1) ou non (0) à la catégorie. Les valeurs de toutes les colonnes doivent donc être 0 ou 1.

Pour inclure le tableau des variables indicatrices dans vos résultats, vous devez cliquer sur Résultats et sélectionner l'option pour afficher le tableau lorsque vous effectuez l'analyse.

Dans ce tableau des variables indicatrices, la première observation de la ligne 1 représente un homme fumeur de poids normal qui a une activité physique régulière. La deuxième observation dans la ligne 2 représente une femme non fumeuse en surpoids qui a une activité physique régulière.
C1 C2 C3 C4 C5 C6 C7 C8 C8
Homme Femme Poids normal Sous-poids Surpoids Fumeur Non fumeur Activité Aucune activité
1 0 1 0 0 1 0 1 0
0 1 0 0 1 0 1 1 0
0 1 1 0 0 0 1 0 1
1 0 1 0 0 0 1 1 0
0 1 0 1 0 0 1 0 1
0 1 0 0 1 1 0 0 1

Tableau de Burt

Un tableau de Burt est une matrice symétrique permettant de visualiser et d'analyser les relations entre des variables de catégorie. Pour inclure le tableau des variables indicatrices dans vos résultats, vous devez cliquer sur Résultats et sélectionner l'option pour afficher le tableau lorsque vous effectuez l'analyse.

Le tableau de Burt possède une colonne et une ligne par niveau (catégorie) de variable de catégorie. Par exemple, si les données sont réparties en 3 variables de catégorie, telles que Sexe (homme, femme), Activité (faible, modérée, élevée) et Age (<20, 20 à 50, >50), le tableau de Burt possède 8 lignes (2 + 3 + 3) et 8 colonnes.
Homme Femme Faible Modérée Elevée <20 20-50 >50
Homme 87 0 33 45 9 26 47 14
Femme 0 163 27 111 25 43 89 31
Faible 33 27 60 0 0 14 48 7
Modérée 45 111 0 111 0 14 107 18
Elevée 9 25 0 0 79 9 30 3
<20 26 43 14 14 9 37 0 0
20-50 47 89 48 107 30 0 185 0
>50 14 31 7 18 3 0 0 28

Chaque entrée du tableau de Burt indique le nombre d'observations qui satisfont aux catégories dans les ligne et colonne correspondantes. Par exemple, l'entrée à l'intersection de la ligne 1 et de la colonne 3 représente le nombre d'observations correspondant à un individu de sexe masculin ayant un faible niveau d'activité (33). De même, l'entrée à l'intersection de la ligne 1 et de la colonne 2 représente le nombre d'observations correspondant aux individus à la fois de sexe masculin et féminin (0).

Le nombre total d'observations pour chaque catégorie figure dans les entrées formant la diagonale descendante ; chacune de ces entrées possède les mêmes en-têtes de colonne et de ligne. Par exemple, l'entrée à l'intersection de la ligne 1 et de la colonne 1 indique le nombre total d'individus de sexe masculin (87), celle à l'intersection de la ligne 2 et de la colonne 2 indique le nombre total d'individus de sexe féminin (163), etc.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique