Effectifs et distances du Khi deux pour la fonction Analyse des correspondances simples

Obtenez des définitions et une interprétation pour chaque statistique fournie pour les effectifs et les distances du Khi deux avec l'analyse des correspondances simples.

Tableau de contingence

Le tableau de contingence trie à plat les observations en fonction de plusieurs variables de catégorie. Les lignes et les colonnes du tableau correspondent à ces variables de catégorie. Le tableau comprend les totaux marginaux de chaque niveau des variables.

Le tableau de contingence de l'analyse des correspondances simples est un tableau à deux entrées qui trie à plat les observations pour deux variables. Vous pouvez également classer les observations pour trois ou quatre variables en utilisant la sous-boîte de dialogue Combiner afin de croiser les variables et de créer les lignes et/ou colonnes d'un tableau à deux entrées.

Interprétation

Utilisez le tableau de contingence pour afficher l'effectif observé pour chaque cellule définie par une catégorie de ligne et une catégorie de colonne. Utilisez le total des lignes et des colonnes pour voir l'effectif total de chaque catégorie.

Tableau de contingence A B C D E Total Géologie 3,000 19,000 39,000 14,000 10,000 85,000 Biochimie 1,000 2,000 13,000 1,000 12,000 29,000 Chimie 6,000 25,000 49,000 21,000 29,000 130,000 Zoologie 3,000 15,000 41,000 35,000 26,000 120,000 Physique 10,000 22,000 47,000 9,000 26,000 114,000 Ingénierie 3,000 11,000 25,000 15,000 34,000 88,000 Microbiologie 1,000 6,000 14,000 5,000 11,000 37,000 Botanique 0,000 12,000 34,000 17,000 23,000 86,000 Statistiques 2,000 5,000 11,000 4,000 7,000 29,000 Mathématiques 2,000 11,000 37,000 8,000 20,000 78,000 Total 31,000 128,000 310,000 129,000 198,000 796,000

Le tableau de contingence à deux entrées suivant indique les dénombrements observés de chercheurs dans chaque discipline universitaire et catégorie de subventions (A, B, C, D, E). La colonne Total indique que la plus grande part des chercheurs relèvent des domaines de la chimie (130), de la zoologie (120) et de la physique (114). La ligne Total indique que la plus grande part des chercheurs sont classés dans la catégorie de subventions C (310). Pour les dénombrements de cellules, les chercheurs en chimie classés dans la catégorie de subventions C ont l'effectif observé le plus élevé (49).

Espérance mathématique des effectifs

L'espérance mathématique des effectifs est le dénombrement d'observations attendu dans une cellule, approximativement, si les variables sont indépendantes. Minitab calcule les dénombrements attendus comme le produit du total des lignes et du total des colonnes, divisé par le nombre total d'observations.

Espérance mathématique des effectifs A B C D E Géologie 3,310 13,668 33,103 13,775 21,143 Biochimie 1,129 4,663 11,294 4,700 7,214 Chimie 5,063 20,905 50,628 21,068 32,337 Zoologie 4,673 19,296 46,734 19,447 29,849 Physique 4,440 18,332 44,397 18,475 28,357 Ingénierie 3,427 14,151 34,271 14,261 21,889 Microbiologie 1,441 5,950 14,410 5,996 9,204 Botanique 3,349 13,829 33,492 13,937 21,392 Statistiques 1,129 4,663 11,294 4,700 7,214 Mathématiques 3,038 12,543 30,377 12,641 19,402

Le tableau de l'espérance mathématique des effectifs suivant indique les dénombrements attendus de chercheurs dans chaque discipline universitaire et catégorie de subventions (A, B, C, D, E), en supposant que la relation entre les subventions et la discipline universitaire est indépendante. La plupart des chercheurs étant en chimie et la plupart des départements relevant de la catégorie de subventions C, la combinaison de ces catégories a la valeur attendue la plus élevée (environ 51).

Espérance mathématique des effectifs observés

L'espérance mathématique des effectifs observés correspond à la différence entre le dénombrement des observations réelles dans la cellule et le dénombrement des observations attendues si les variables sont indépendantes.

Interprétation

Utilisez la différence entre les effectifs observés et leur espérance mathématique pour rechercher des preuves d'associations possibles dans les données. Si deux variables sont associées, la distribution des observations pour une variable varie en fonction de la catégorie de la seconde variable. Par conséquent, la différence entre l'effectif observé et son espérance mathématique est relativement importante. Si deux variables sont indépendantes, la distribution des observations pour une variable est la même pour toutes les catégories de la seconde variable. La différence entre l'effectif observé et son espérance mathématique est donc relativement réduite.

Espérance mathématique des effectifs observés A B C D E Géologie -0,310 5,332 5,897 0,225 -11,143 Biochimie -0,129 -2,663 1,706 -3,700 4,786 Chimie 0,937 4,095 -1,628 -0,068 -3,337 Zoologie -1,673 -4,296 -5,734 15,553 -3,849 Physique 5,560 3,668 2,603 -9,475 -2,357 Ingénierie -0,427 -3,151 -9,271 0,739 12,111 Microbiologie -0,441 0,050 -0,410 -0,996 1,796 Botanique -3,349 -1,829 0,508 3,063 1,608 Statistiques 0,871 0,337 -0,294 -0,700 -0,214 Mathématiques -1,038 -1,543 6,623 -4,641 0,598

Dans ce tableau, la différence entre le dénombrement observé et le dénombrement attendu est relativement importante pour Zoologie et la catégorie de subventions D (15,553), ainsi que pour Ingénierie et la catégorie de subventions E (12,111). Pour ces cellules, les dénombrements observés sont supérieurs au dénombrement qui serait obtenu si les variables étaient indépendantes. La différence est relativement importante aussi pour Géologie et la catégorie de subventions E (-11,143). Pour cette cellule, le dénombrement observé est inférieur au dénombrement qui serait obtenu si les variables étaient indépendantes. Vous pouvez donc en conclure que les départements d'ingénierie non subventionnés sont bien plus nombreux que prévu et que les départements de géologie non subventionnés sont bien moins nombreux que prévu.

Distances du Khi deux

Minitab affiche la contribution de chaque cellule à la statistique du Khi deux comme la distance du Khi deux. La distance du Khi deux de chaque cellule permet de quantifier la part de la statistique totale du Khi deux attribuable à la divergence de chaque cellule.

Minitab calcule la contribution de chaque cellule à la statistique du Khi deux comme le carré de la différence entre les valeurs observées et attendues d'une cellule, divisé par la valeur attendue de cette dernière. Le Khi deux total est la somme des valeurs pour toutes les cellules.

Interprétation

Vous pouvez comparer les distances du Khi deux pour chaque cellule afin d'évaluer quelles cellules contribuent le plus au Khi deux total. Si les effectifs de cellules observés et leur espérance mathématique présentent des différences significatives, la valeur du Khi deux de la cellule est élevée. Par conséquent, une distance du Khi deux élevée dans une cellule suggère une association entre les catégories de lignes et de colonnes plus forte que si elle avait été le fruit du hasard.

Distances du Khi deux A B C D E Total Géologie 0,029 2,080 1,050 0,004 5,873 9,036 Biochimie 0,015 1,521 0,258 2,913 3,176 7,882 Chimie 0,173 0,802 0,052 0,000 0,344 1,373 Zoologie 0,599 0,957 0,703 12,438 0,496 15,194 Physique 6,964 0,734 0,153 4,859 0,196 12,906 Ingénierie 0,053 0,702 2,508 0,038 6,700 10,001 Microbiologie 0,135 0,000 0,012 0,166 0,351 0,663 Botanique 3,349 0,242 0,008 0,673 0,121 4,393 Statistiques 0,671 0,024 0,008 0,104 0,006 0,814 Mathématiques 0,354 0,190 1,444 1,704 0,018 3,710 Total 12,343 7,252 6,196 22,899 17,282 65,972

Dans ce tableau, la cellule à l'intersection de Zoologie et de la catégorie de subventions D est 12,438, ce qui représente la contribution la plus importante au Khi deux total (65,972). Parmi les catégories de lignes, Zoologie (15,194), Physique (12,906) et Ingénierie (10,001) contribuent le plus au Khi deux total. Parmi les catégories de colonnes, les niveaux de subventions D (22,899) et E (17,282) contribuent le plus au Khi deux total.

Inerties relatives

L'inertie de cellule est la valeur du Khi deux de la cellule divisée par l'effectif total du tableau de contingence. La somme des inerties individuelles des cellules est égale à l'inertie totale, ou simplement inertie. L'inertie relative d'une cellule est égale à l'inertie de la cellule divisée par l'inertie totale. L'inertie relative d'une ligne est la somme des inerties individuelles des cellules pour la ligne divisée par l'inertie totale. L'inertie relative d'une colonne est la somme des inerties individuelles des cellules pour la colonne divisée par l'inertie totale.

Interprétation

Utilisez l'inertie relative pour évaluer la force des associations entre catégories et les contributions à la variation des données. En général, plus les valeurs sont élevées, plus l'association est forte et plus la proportion de la variabilité totale par rapport aux valeurs attendues dans les données est élevée.

Inerties relatives A B C D E Total Géologie 0,000 0,032 0,016 0,000 0,089 0,137 Biochimie 0,000 0,023 0,004 0,044 0,048 0,119 Chimie 0,003 0,012 0,001 0,000 0,005 0,021 Zoologie 0,009 0,015 0,011 0,189 0,008 0,230 Physique 0,106 0,011 0,002 0,074 0,003 0,196 Ingénierie 0,001 0,011 0,038 0,001 0,102 0,152 Microbiologie 0,002 0,000 0,000 0,003 0,005 0,010 Botanique 0,051 0,004 0,000 0,010 0,002 0,067 Statistiques 0,010 0,000 0,000 0,002 0,000 0,012 Mathématiques 0,005 0,003 0,022 0,026 0,000 0,056 Total 0,187 0,110 0,094 0,347 0,262 1,000

Le tableau Inerties relatives indique la contribution relative de chaque cellule à la statistique totale du Khi deux. Plus l'inertie relative est élevée dans une cellule, plus l'association entre les catégories de lignes et de colonnes est forte. Dans ce tableau, la cellule à l'intersection de Zoologie et de la catégorie de subventions D a l'inertie relative la plus élevée (0,189), ce qui correspond à l'association la plus forte du tableau. Le tableau indique également l'inertie relative totale de chaque ligne et colonne.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique