Effectifs et distances du Khi deux pour la fonction Analyse des correspondances simples

Obtenez des définitions et une interprétation pour chaque statistique fournie pour les effectifs et les distances du Khi deux avec l'analyse des correspondances simples.

Tableau de contingence

Le tableau de contingence trie à plat les observations en fonction de plusieurs variables de catégorie. Les lignes et les colonnes du tableau correspondent à ces variables de catégorie. Le tableau comprend les totaux marginaux de chaque niveau des variables.

Le tableau de contingence de l'analyse des correspondances simples est un tableau à deux entrées qui trie à plat les observations pour deux variables. Vous pouvez également classer les observations pour trois ou quatre variables en utilisant la sous-boîte de dialogue Combiner afin de croiser les variables et de créer les lignes et/ou colonnes d'un tableau à deux entrées.

Interprétation

Utilisez le tableau de contingence pour afficher l'effectif observé pour chaque cellule définie par une catégorie de ligne et une catégorie de colonne. Utilisez le total des lignes et des colonnes pour voir l'effectif total de chaque catégorie.

Tableau de contingence

ABCDETotal
Géologie3,00019,00039,00014,00010,00085,000
Biochimie1,0002,00013,0001,00012,00029,000
Chimie6,00025,00049,00021,00029,000130,000
Zoologie3,00015,00041,00035,00026,000120,000
Physique10,00022,00047,0009,00026,000114,000
Ingénierie3,00011,00025,00015,00034,00088,000
Microbiologie1,0006,00014,0005,00011,00037,000
Botanique0,00012,00034,00017,00023,00086,000
Statistiques2,0005,00011,0004,0007,00029,000
Mathématiques2,00011,00037,0008,00020,00078,000
Total31,000128,000310,000129,000198,000796,000

Le tableau de contingence à deux entrées suivant indique les dénombrements observés de chercheurs dans chaque discipline universitaire et catégorie de subventions (A, B, C, D, E). La colonne Total indique que la plus grande part des chercheurs relèvent des domaines de la chimie (130), de la zoologie (120) et de la physique (114). La ligne Total indique que la plus grande part des chercheurs sont classés dans la catégorie de subventions C (310). Pour les dénombrements de cellules, les chercheurs en chimie classés dans la catégorie de subventions C ont l'effectif observé le plus élevé (49).

Espérance mathématique des effectifs

L'espérance mathématique des effectifs est le dénombrement d'observations attendu dans une cellule, approximativement, si les variables sont indépendantes. Minitab calcule les dénombrements attendus comme le produit du total des lignes et du total des colonnes, divisé par le nombre total d'observations.

Espérance mathématique des effectifs

ABCDE
Géologie3,31013,66833,10313,77521,143
Biochimie1,1294,66311,2944,7007,214
Chimie5,06320,90550,62821,06832,337
Zoologie4,67319,29646,73419,44729,849
Physique4,44018,33244,39718,47528,357
Ingénierie3,42714,15134,27114,26121,889
Microbiologie1,4415,95014,4105,9969,204
Botanique3,34913,82933,49213,93721,392
Statistiques1,1294,66311,2944,7007,214
Mathématiques3,03812,54330,37712,64119,402

Le tableau de l'espérance mathématique des effectifs suivant indique les dénombrements attendus de chercheurs dans chaque discipline universitaire et catégorie de subventions (A, B, C, D, E), en supposant que la relation entre les subventions et la discipline universitaire est indépendante. La plupart des chercheurs étant en chimie et la plupart des départements relevant de la catégorie de subventions C, la combinaison de ces catégories a la valeur attendue la plus élevée (environ 51).

Espérance mathématique des effectifs observés

L'espérance mathématique des effectifs observés correspond à la différence entre le dénombrement des observations réelles dans la cellule et le dénombrement des observations attendues si les variables sont indépendantes.

Interprétation

Utilisez la différence entre les effectifs observés et leur espérance mathématique pour rechercher des preuves d'associations possibles dans les données. Si deux variables sont associées, la distribution des observations pour une variable varie en fonction de la catégorie de la seconde variable. Par conséquent, la différence entre l'effectif observé et son espérance mathématique est relativement importante. Si deux variables sont indépendantes, la distribution des observations pour une variable est la même pour toutes les catégories de la seconde variable. La différence entre l'effectif observé et son espérance mathématique est donc relativement réduite.

Espérance mathématique des effectifs observés

ABCDE
Géologie-0,3105,3325,8970,225-11,143
Biochimie-0,129-2,6631,706-3,7004,786
Chimie0,9374,095-1,628-0,068-3,337
Zoologie-1,673-4,296-5,73415,553-3,849
Physique5,5603,6682,603-9,475-2,357
Ingénierie-0,427-3,151-9,2710,73912,111
Microbiologie-0,4410,050-0,410-0,9961,796
Botanique-3,349-1,8290,5083,0631,608
Statistiques0,8710,337-0,294-0,700-0,214
Mathématiques-1,038-1,5436,623-4,6410,598

Dans ce tableau, la différence entre le dénombrement observé et le dénombrement attendu est relativement importante pour Zoologie et la catégorie de subventions D (15,553), ainsi que pour Ingénierie et la catégorie de subventions E (12,111). Pour ces cellules, les dénombrements observés sont supérieurs au dénombrement qui serait obtenu si les variables étaient indépendantes. La différence est relativement importante aussi pour Géologie et la catégorie de subventions E (-11,143). Pour cette cellule, le dénombrement observé est inférieur au dénombrement qui serait obtenu si les variables étaient indépendantes. Vous pouvez donc en conclure que les départements d'ingénierie non subventionnés sont bien plus nombreux que prévu et que les départements de géologie non subventionnés sont bien moins nombreux que prévu.

Distances du Khi deux

Minitab affiche la contribution de chaque cellule à la statistique du Khi deux comme la distance du Khi deux. La distance du Khi deux de chaque cellule permet de quantifier la part de la statistique totale du Khi deux attribuable à la divergence de chaque cellule.

Minitab calcule la contribution de chaque cellule à la statistique du Khi deux comme le carré de la différence entre les valeurs observées et attendues d'une cellule, divisé par la valeur attendue de cette dernière. Le Khi deux total est la somme des valeurs pour toutes les cellules.

Interprétation

Vous pouvez comparer les distances du Khi deux pour chaque cellule afin d'évaluer quelles cellules contribuent le plus au Khi deux total. Si les effectifs de cellules observés et leur espérance mathématique présentent des différences significatives, la valeur du Khi deux de la cellule est élevée. Par conséquent, une distance du Khi deux élevée dans une cellule suggère une association entre les catégories de lignes et de colonnes plus forte que si elle avait été le fruit du hasard.

Distances du Khi deux

ABCDETotal
Géologie0,0292,0801,0500,0045,8739,036
Biochimie0,0151,5210,2582,9133,1767,882
Chimie0,1730,8020,0520,0000,3441,373
Zoologie0,5990,9570,70312,4380,49615,194
Physique6,9640,7340,1534,8590,19612,906
Ingénierie0,0530,7022,5080,0386,70010,001
Microbiologie0,1350,0000,0120,1660,3510,663
Botanique3,3490,2420,0080,6730,1214,393
Statistiques0,6710,0240,0080,1040,0060,814
Mathématiques0,3540,1901,4441,7040,0183,710
Total12,3437,2526,19622,89917,28265,972

Dans ce tableau, la cellule à l'intersection de Zoologie et de la catégorie de subventions D est 12,438, ce qui représente la contribution la plus importante au Khi deux total (65,972). Parmi les catégories de lignes, Zoologie (15,194), Physique (12,906) et Ingénierie (10,001) contribuent le plus au Khi deux total. Parmi les catégories de colonnes, les niveaux de subventions D (22,899) et E (17,282) contribuent le plus au Khi deux total.

Inerties relatives

L'inertie de cellule est la valeur du Khi deux de la cellule divisée par l'effectif total du tableau de contingence. La somme des inerties individuelles des cellules est égale à l'inertie totale, ou simplement inertie. L'inertie relative d'une cellule est égale à l'inertie de la cellule divisée par l'inertie totale. L'inertie relative d'une ligne est la somme des inerties individuelles des cellules pour la ligne divisée par l'inertie totale. L'inertie relative d'une colonne est la somme des inerties individuelles des cellules pour la colonne divisée par l'inertie totale.

Interprétation

Utilisez l'inertie relative pour évaluer la force des associations entre catégories et les contributions à la variation des données. En général, plus les valeurs sont élevées, plus l'association est forte et plus la proportion de la variabilité totale par rapport aux valeurs attendues dans les données est élevée.

Inerties relatives

ABCDETotal
Géologie0,0000,0320,0160,0000,0890,137
Biochimie0,0000,0230,0040,0440,0480,119
Chimie0,0030,0120,0010,0000,0050,021
Zoologie0,0090,0150,0110,1890,0080,230
Physique0,1060,0110,0020,0740,0030,196
Ingénierie0,0010,0110,0380,0010,1020,152
Microbiologie0,0020,0000,0000,0030,0050,010
Botanique0,0510,0040,0000,0100,0020,067
Statistiques0,0100,0000,0000,0020,0000,012
Mathématiques0,0050,0030,0220,0260,0000,056
Total0,1870,1100,0940,3470,2621,000

Le tableau Inerties relatives indique la contribution relative de chaque cellule à la statistique totale du Khi deux. Plus l'inertie relative est élevée dans une cellule, plus l'association entre les catégories de lignes et de colonnes est forte. Dans ce tableau, la cellule à l'intersection de Zoologie et de la catégorie de subventions D a l'inertie relative la plus élevée (0,189), ce qui correspond à l'association la plus forte du tableau. Le tableau indique également l'inertie relative totale de chaque ligne et colonne.