Un tableau de contingence trie à plat les observations en fonction de plusieurs variables de catégorie. Les lignes et les colonnes du tableau correspondent à ces variables de catégorie.
Par exemple, après une récente élection opposant deux candidats, un sondage a enregistré le sexe et le vote de 100 électeurs choisis de façon aléatoire, et les données obtenues ont été organisées en tableau, comme suit :
Candidat A | Candidat B | Total | |
---|---|---|---|
Homme | 28 | 20 | 48 |
Femme | 39 | 13 | 52 |
Total | 67 | 33 | 100 |
Ce tableau de contingence trie à plat les réponses en fonction du sexe et du vote. Le dénombrement à l'intersection de la ligne i et de la colonne j est noté nij et désigne le nombre d'observations qui présentent cette combinaison de niveaux. Par exemple, n1,2 indique le nombre de répondants de sexe masculin qui ont voté pour le candidat B.
Le tableau comprend également les totaux marginaux de chaque niveau des variables. Les totaux marginaux des lignes indiquent que 52 répondants sont de sexe féminin. Les totaux marginaux des colonnes indiquent que 67 répondants ont voté pour le candidat A. En outre, le total général indique que l'effectif de l'échantillon est de 100.
Les tableaux de contingence peuvent également mettre en évidence les associations entre les deux variables. Utilisez un test du Khi deux ou un test exact de Fisher pour déterminer si les dénombrements observés diffèrent de manière significative des dénombrements attendus dans le cas de l'hypothèse nulle d'absence d'association. Par exemple, vous pouvez déterminer si une association existe entre le sexe et le vote.
Les tableaux de contingence les plus simples sont des tableaux à deux entrées qui trient à plat les réponses en fonction de deux variables. Vous pouvez classer les observations en fonction de trois variables (ou plus) en "croisant" ces dernières. Dans l'exemple du vote ci-dessus, vous pouvez affiner le classement des réponses en fonction de la situation d'emploi :
Candidat A | Candidat B | Total | |
---|---|---|---|
Individu de sexe masculin/salarié | 18 | 19 | 37 |
Individu de sexe masculin/chômeur | 10 | 1 | 11 |
Individu de sexe féminin/salarié | 33 | 10 | 43 |
Individu de sexe féminin/chômeur | 6 | 3 | 9 |
Total | 67 | 33 | 100 |
L'analyse des correspondances simples peut détecter, dans les tableaux de contingence, les associations dont le classement des données repose sur trois variables (ou plus). Pour effectuer une analyse des correspondances simples dans Minitab, sélectionnez
.Vous pouvez utiliser pour calculer le rapport des probabilités de succès et l'intervalle de confiance.
Crise cardiaque | Pas de crise cardiaque | |
---|---|---|
Placebo | 189 | 10845 |
Aspirine | 104 | 10933 |
C1 | C2 | C3 |
---|---|---|
Groupe | Crise cardiaque | Dénombrement |
Placebo | Oui | 189 |
Placebo | Non | 10845 |
Aspirine | Oui | 104 |
Aspirine | Non | 10933 |
Le rapport des probabilités de succès est de 1,8321. Cela signifie que la probabilité d'avoir une crise cardiaque est 1,8321 fois plus élevée pour une personne prenant le placebo que pour une personne prenant de l'aspirine. Vous pouvez être sûr à 95 % que la valeur réelle du rapport des probabilités de succès est comprise entre 1,44 et 2,3308.
Les données utilisées dans cet exemple proviennent de la page 20 de l'ouvrage A. Agresti (1996). An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc.