Exemple pour la fonction Analyse des correspondances simples

Un directeur de recherche universitaire souhaite comparer dix disciplines universitaires en fonction de cinq catégories de financement différentes. Il collecte pour cela des données de classification à deux facteurs pour 796 chercheurs.

Pour cette classification à deux facteurs, les disciplines universitaires sont représentées dans les lignes et les catégories de financement dans les colonnes. A correspond à la catégorie de financement la plus élevée, D à la plus faible, tandis que E représente l'absence de financement. Le directeur effectue une analyse des correspondances simples pour représenter les associations entre les lignes et les colonnes.

Le responsable souhaite également étudier les données supplémentaires qui ne sont pas incluses dans le fichier de données principal. Ces données comprennent une ligne supplémentaire pour les chercheurs des musées et une ligne pour les sciences mathématiques, qui est la somme de Mathématiques et de Statistiques.

  1. Ouvrez le fichier de données échantillons, FinancementRecherche.MTW.
  2. Sélectionnez Stat > Multivarié > Analyse des correspondances simples.
  3. Sous Données d'entrée, sélectionnez Colonnes d'un tableau de contingence et entrez CT1-CT5. Dans Noms des lignes, entrez NomLigne. Dans Noms des colonnes, entrez NomCol.
  4. Cliquez sur Résultats, puis sélectionnez Profils des lignes. Cliquez sur OK.
  5. Cliquez sur Données supp. Dans la zone Lignes supplémentaires, saisissez LigneSup1 LigneSup2. Dans la zone Noms des lignes, saisissez NomLSup. Cliquez sur OK.
  6. Cliquez sur Graphiques. Sélectionnez Afficher les points supplémentaires dans tous les diagrammes. Sélectionnez Diagramme de symétrie montrant seulement les lignes et Diagramme à lignes asymétrique montrant les lignes et les colonnes.
  7. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Le tableau Profils des lignes montre les proportions de chaque catégorie de ligne par colonne. Par exemple, pour Géologie, 3,5 % des chercheurs se trouvent dans la catégorie de subventions A, 22,4 % dans la catégorie de subventions B, etc. La masse de chaque ligne indique la proportion de chercheurs dans le fichier de données entier. Par exemple, la masse pour Géologie est 0,107, ce qui signifie que 10,7 % des chercheurs appartiennent au domaine de la géologie.

Vous pouvez utiliser les valeurs des tableaux Contributions des lignes et Contributions des colonnes pour interpréter les différentes composantes. La colonne étiquetée Qual., pour qualité, indique la proportion de l'inertie de ligne représentée par les deux composantes.

Par exemple, pour les contributions des lignes, Zoologie (0,929) et Géologie (0,916) sont les domaines les mieux représentés par la distribution des deux composantes. La représentation de Maths est la moins bonne, avec une valeur de qualité de 0,319. Pour les contributions des colonnes, les deux composantes expliquent la majeure partie de la variabilité dans les catégories de subventions B, D et E. Les catégories de subventions A, B, C et D contribuent le plus à la composante 1, tandis que la catégorie E, indiquant l'absence de subvention, contribue le plus à la composante 2.

Le diagramme à lignes indique les coordonnées principales des lignes. La composante 1, qui explique le mieux Zoologie et Physique, montre ces deux domaines les plus éloignés de l'origine, mais de signe opposé. Ainsi, la composante 1 montre le contraste des sciences biologiques Zoologie et Botanique par rapport à Physique. La composante 2 montre le contraste de Biochimie et Ingénierie par rapport à Géologie.

Dans le diagramme à lignes asymétrique, les lignes sont à l'échelle des coordonnées principales et les colonnes à l'échelle des coordonnées normalisées. Parmi les classes de subventions, la composante 1 montre les contrastes entre les niveaux de subventions, alors que la composante 2 montre les contrastes entre les catégories qui sont subventionnées (A à D) et celle qui ne l'est pas (E). Parmi les disciplines, Physique tend à avoir le plus haut niveau de subventions et Zoologie le plus faible. La biochimie se situe à un niveau de subventions moyen, mais avec le taux le plus élevé en ce qui concerne les chercheurs ne bénéficiant d'aucun financement. Les musées tendent à être subventionnés, mais à un niveau plus faible que les chercheurs universitaires.

Analyse des correspondances simples : CT1; CT2; CT3; CT4; CT5

Profil des lignes A B C D E Masse Géologie 0,035 0,224 0,459 0,165 0,118 0,107 Biochimie 0,034 0,069 0,448 0,034 0,414 0,036 Chimie 0,046 0,192 0,377 0,162 0,223 0,163 Zoologie 0,025 0,125 0,342 0,292 0,217 0,151 Physique 0,088 0,193 0,412 0,079 0,228 0,143 Ingénierie 0,034 0,125 0,284 0,170 0,386 0,111 Microbiologie 0,027 0,162 0,378 0,135 0,297 0,046 Botanique 0,000 0,140 0,395 0,198 0,267 0,108 Statistiques 0,069 0,172 0,379 0,138 0,241 0,036 Mathématiques 0,026 0,141 0,474 0,103 0,256 0,098 Masse 0,039 0,161 0,389 0,162 0,249
Analyse du tableau de contingence Axe Inertie Proportion Cumulée 1 0,0391 0,4720 0,4720 2 0,0304 0,3666 0,8385 3 0,0109 0,1311 0,9697 4 0,0025 0,0303 1,0000 Total 0,0829
Contribution des lignes Composante 1 ID Nom Qual. Masse Inerte Coord Corr Contrib 1 Géologie 0,916 0,107 0,137 -0,076 0,055 0,016 2 Biochimie 0,881 0,036 0,119 -0,180 0,119 0,030 3 Chimie 0,644 0,163 0,021 -0,038 0,134 0,006 4 Zoologie 0,929 0,151 0,230 0,327 0,846 0,413 5 Physique 0,886 0,143 0,196 -0,316 0,880 0,365 6 Ingénierie 0,870 0,111 0,152 0,117 0,121 0,039 7 Microbiologie 0,680 0,046 0,010 -0,013 0,009 0,000 8 Botanique 0,654 0,108 0,067 0,179 0,625 0,088 9 Statistiques 0,561 0,036 0,012 -0,125 0,554 0,014 10 Mathématiques 0,319 0,098 0,056 -0,107 0,240 0,029 Composante 2 ID Nom Coord Corr Contrib 1 Géologie -0,303 0,861 0,322 2 Biochimie 0,455 0,762 0,248 3 Chimie -0,073 0,510 0,029 4 Zoologie -0,102 0,083 0,052 5 Physique -0,027 0,006 0,003 6 Ingénierie 0,292 0,749 0,310 7 Microbiologie 0,110 0,671 0,018 8 Botanique 0,039 0,029 0,005 9 Statistiques -0,014 0,007 0,000 10 Mathématiques 0,061 0,079 0,012
Lignes supplémentaires Composante 1 ID Nom Qual. Masse Inerte Coord Corr Contrib 1 Musées 0,556 0,067 0,353 0,314 0,225 0,168 2 SciMaths 0,559 0,134 0,041 -0,112 0,493 0,043 Composante 2 ID Nom Coord Corr Contrib 1 Musées -0,381 0,331 0,318 2 SciMaths 0,041 0,066 0,007
Contributions des colonnes Composante 1 Composante 2 ID Nom Qual. Masse Inerte Coord Corr Contrib Coord Corr Contrib 1 A 0,587 0,039 0,187 -0,478 0,574 0,228 -0,072 0,013 0,007 2 B 0,816 0,161 0,110 -0,127 0,286 0,067 -0,173 0,531 0,159 3 C 0,465 0,389 0,094 -0,083 0,341 0,068 -0,050 0,124 0,032 4 D 0,968 0,162 0,347 0,390 0,859 0,632 -0,139 0,109 0,103 5 E 0,990 0,249 0,262 0,032 0,012 0,006 0,292 0,978 0,699

Diagramme à lignes

Diagramme à lignes asymétrique

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique