Supposons qu'un tableau de contingence soit composé de r lignes et de c colonnes. L'entrée nij à l'intersection de la ligne i et de la colonne j du tableau de contingence représente l'effectif de cette cellule. Le total de la ligne i, ni., correspond à la somme des effectifs de la ligne i. Le total de la colonne j, n.j, correspond à la somme des effectifs de la colonne j. Le total du tableau, n.. ou simplement n, correspond à la somme de tous les effectifs du tableau.
Les profils sont les proportions calculées à partir des dénombrements nij du tableau de contingence initial. En particulier, le profil de la ligne i est (ni1 / ni., ..., nic / ni.) ; le profil de la colonne j est (n1j / n.j, ..., nrj / n.j).
Le profil de ligne moyen est calculé à partir du total des colonnes. En particulier, le profil de ligne moyen est (n.1 / n, ..., n.c / n). De même, le profil de colonne moyen est calculé à partir du total des lignes. En particulier, le profil de colonne moyen est (n1. / n,..., nr. / n).
Si les effectifs de cellules observés et leur espérance mathématique présentent des différences significatives, la valeur du χ2 de la cellule est élevée.
La statistique du χ2 est la somme des valeurs du χ2 de toutes les cellules du tableau. Cette statistique mesure l'écart d'homogénéité des profils de lignes ou des profils de colonnes. Si les profils de lignes (colonnes) sont très différents les uns des autres, la statistique du χ2 est élevée. La statistique du χ2 peut également être considérée comme une mesure de la distance entre les profils de lignes (ou de colonnes) et le profil de ligne (colonne) moyen.
Terme | Description |
---|---|
nij | effectif observé dans la cellule |
eij | espérance mathématique de l'effectif dans la cellule |