Exemple pour la fonction Analyse des correspondances simples

Un directeur de recherche universitaire souhaite comparer dix disciplines universitaires en fonction de cinq catégories de financement différentes. Il collecte pour cela des données de classification à deux facteurs pour 796 chercheurs.

Pour cette classification à deux facteurs, les disciplines universitaires sont représentées dans les lignes et les catégories de financement dans les colonnes. A correspond à la catégorie de financement la plus élevée, D à la plus faible, tandis que E représente l'absence de financement. Le directeur effectue une analyse des correspondances simples pour représenter les associations entre les lignes et les colonnes.

Le responsable souhaite également étudier les données supplémentaires qui ne sont pas incluses dans le fichier de données principal. Ces données comprennent une ligne supplémentaire pour les chercheurs des musées et une ligne pour les sciences mathématiques, qui est la somme de Mathématiques et de Statistiques.

  1. Ouvrez le fichier de données échantillons, FinancementRecherche.MTW.
  2. Sélectionnez Stat > Multivariée > Analyse des correspondances simples.
  3. Sous Données d'entrée, sélectionnez Colonnes d'un tableau de contingence et entrez CT1-CT5. Dans Noms des lignes, entrez NomLigne. Dans Noms des colonnes, entrez NomCol.
  4. Cliquez sur Résultats, puis sélectionnez Profils des lignes. Cliquez sur OK.
  5. Cliquez sur Données supplémentaires. Dans la zone Lignes supplémentaires, saisissez LigneSup1LigneSup2. Dans la zone Noms des lignes, saisissez NomLSup. Cliquez sur OK.
  6. Cliquez sur Graphiques. Sélectionnez Afficher les points supplémentaires dans tous les diagrammes. Sélectionnez Diagramme de symétrie montrant seulement les lignes et Diagramme à lignes asymétrique montrant les lignes et les colonnes.
  7. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Le tableau Profils des lignes montre les proportions de chaque catégorie de ligne par colonne. Par exemple, pour Géologie, 3,5 % des chercheurs se trouvent dans la catégorie de subventions A, 22,4 % dans la catégorie de subventions B, etc. La masse de chaque ligne indique la proportion de chercheurs dans le fichier de données entier. Par exemple, la masse pour Géologie est 0,107, ce qui signifie que 10,7 % des chercheurs appartiennent au domaine de la géologie.

Vous pouvez utiliser les valeurs des tableaux Contributions des lignes et Contributions des colonnes pour interpréter les différentes composantes. La colonne étiquetée Qual., pour qualité, indique la proportion de l'inertie de ligne représentée par les deux composantes.

Par exemple, pour les contributions des lignes, Zoologie (0,929) et Géologie (0,916) sont les domaines les mieux représentés par la distribution des deux composantes. La représentation de Maths est la moins bonne, avec une valeur de qualité de 0,319. Pour les contributions des colonnes, les deux composantes expliquent la majeure partie de la variabilité dans les catégories de subventions B, D et E. Les catégories de subventions A, B, C et D contribuent le plus à la composante 1, tandis que la catégorie E, indiquant l'absence de subvention, contribue le plus à la composante 2.

Le diagramme à lignes indique les coordonnées principales des lignes. La composante 1, qui explique le mieux Zoologie et Physique, montre ces deux domaines les plus éloignés de l'origine, mais de signe opposé. Ainsi, la composante 1 montre le contraste des sciences biologiques Zoologie et Botanique par rapport à Physique. La composante 2 montre le contraste de Biochimie et Ingénierie par rapport à Géologie.

Dans le diagramme à lignes asymétrique, les lignes sont à l'échelle des coordonnées principales et les colonnes à l'échelle des coordonnées normalisées. Parmi les classes de subventions, la composante 1 montre les contrastes entre les niveaux de subventions, alors que la composante 2 montre les contrastes entre les catégories qui sont subventionnées (A à D) et celle qui ne l'est pas (E). Parmi les disciplines, Physique tend à avoir le plus haut niveau de subventions et Zoologie le plus faible. La biochimie se situe à un niveau de subventions moyen, mais avec le taux le plus élevé en ce qui concerne les chercheurs ne bénéficiant d'aucun financement. Les musées tendent à être subventionnés, mais à un niveau plus faible que les chercheurs universitaires.

Profil des lignes

ABCDEMasse
Géologie0,0350,2240,4590,1650,1180,107
Biochimie0,0340,0690,4480,0340,4140,036
Chimie0,0460,1920,3770,1620,2230,163
Zoologie0,0250,1250,3420,2920,2170,151
Physique0,0880,1930,4120,0790,2280,143
Ingénierie0,0340,1250,2840,1700,3860,111
Microbiologie0,0270,1620,3780,1350,2970,046
Botanique0,0000,1400,3950,1980,2670,108
Statistiques0,0690,1720,3790,1380,2410,036
Mathématiques0,0260,1410,4740,1030,2560,098
Masse0,0390,1610,3890,1620,249 

Analyse du tableau de contingence

AxeInertieProportionCumulée
10,03910,47200,4720
20,03040,36660,8385
30,01090,13110,9697
40,00250,03031,0000
Total0,0829   

Contribution des lignes






Composante 1Composante 2
IDNomQual.MasseInerteCoordCorrContribCoordCorrContrib
1Géologie0,9160,1070,137-0,0760,0550,016-0,3030,8610,322
2Biochimie0,8810,0360,119-0,1800,1190,0300,4550,7620,248
3Chimie0,6440,1630,021-0,0380,1340,006-0,0730,5100,029
4Zoologie0,9290,1510,2300,3270,8460,413-0,1020,0830,052
5Physique0,8860,1430,196-0,3160,8800,365-0,0270,0060,003
6Ingénierie0,8700,1110,1520,1170,1210,0390,2920,7490,310
7Microbiologie0,6800,0460,010-0,0130,0090,0000,1100,6710,018
8Botanique0,6540,1080,0670,1790,6250,0880,0390,0290,005
9Statistiques0,5610,0360,012-0,1250,5540,014-0,0140,0070,000
10Mathématiques0,3190,0980,056-0,1070,2400,0290,0610,0790,012

Lignes supplémentaires






Composante 1Composante 2
IDNomQual.MasseInerteCoordCorrContribCoordCorrContrib
1Musées0,5560,0670,3530,3140,2250,168-0,3810,3310,318
2SciMaths0,5590,1340,041-0,1120,4930,0430,0410,0660,007

Contributions des colonnes






Composante 1Composante 2
IDNomQual.MasseInerteCoordCorrContribCoordCorrContrib
1A0,5870,0390,187-0,4780,5740,228-0,0720,0130,007
2B0,8160,1610,110-0,1270,2860,067-0,1730,5310,159
3C0,4650,3890,094-0,0830,3410,068-0,0500,1240,032
4D0,9680,1620,3470,3900,8590,632-0,1390,1090,103
5E0,9900,2490,2620,0320,0120,0060,2920,9780,699