Tableaux de contingence

Sur ce thème

Qu'est-ce qu'un tableau de contingence ?
Calculer le rapport des probabilités de succès et l'intervalle de confiance d'un tableau de contingence 2 x 2

Qu'est-ce qu'un tableau de contingence ?

Un tableau de contingence trie à plat les observations en fonction de plusieurs variables de catégorie. Les lignes et les colonnes du tableau correspondent à ces variables de catégorie.

Par exemple, après une récente élection opposant deux candidats, un sondage a enregistré le sexe et le vote de 100 électeurs choisis de façon aléatoire, et les données obtenues ont été organisées en tableau, comme suit :

	Candidat A	Candidat B	Total
Homme	28	20	48
Femme	39	13	52
Total	67	33	100

Ce tableau de contingence trie à plat les réponses en fonction du sexe et du vote. Le dénombrement à l'intersection de la ligne i et de la colonne j est noté n_ij et désigne le nombre d'observations qui présentent cette combinaison de niveaux. Par exemple, n_1,2 indique le nombre de répondants de sexe masculin qui ont voté pour le candidat B.

Le tableau comprend également les totaux marginaux de chaque niveau des variables. Les totaux marginaux des lignes indiquent que 52 répondants sont de sexe féminin. Les totaux marginaux des colonnes indiquent que 67 répondants ont voté pour le candidat A. En outre, le total général indique que l'effectif de l'échantillon est de 100.

Les tableaux de contingence peuvent également mettre en évidence les associations entre les deux variables. Utilisez un test du Khi deux ou un test exact de Fisher pour déterminer si les dénombrements observés diffèrent de manière significative des dénombrements attendus dans le cas de l'hypothèse nulle d'absence d'association. Par exemple, vous pouvez déterminer si une association existe entre le sexe et le vote.

Les tableaux de contingence les plus simples sont des tableaux à deux entrées qui trient à plat les réponses en fonction de deux variables. Vous pouvez classer les observations en fonction de trois variables (ou plus) en "croisant" ces dernières. Dans l'exemple du vote ci-dessus, vous pouvez affiner le classement des réponses en fonction de la situation d'emploi :

	Candidat A	Candidat B	Total
Individu de sexe masculin/salarié	18	19	37
Individu de sexe masculin/chômeur	10	1	11
Individu de sexe féminin/salarié	33	10	43
Individu de sexe féminin/chômeur	6	3	9
Total	67	33	100

L'analyse des correspondances simples peut détecter, dans les tableaux de contingence, les associations dont le classement des données repose sur trois variables (ou plus). Pour effectuer une analyse des correspondances simples dans Minitab, sélectionnez Stat > Multivariée > Analyse des correspondances simples.

Calculer le rapport des probabilités de succès et l'intervalle de confiance d'un tableau de contingence 2 x 2

Vous pouvez utiliser Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire pour calculer le rapport des probabilités de succès et l'intervalle de confiance.

Par exemple, vous étudiez la relation entre la consommation d'aspirine et les crises cardiaques, et souhaitez calculer le rapport des probabilités de succès et son intervalle de confiance à partir du tableau de contingence 2 x 2 suivant :

	Crise cardiaque	Pas de crise cardiaque
Placebo	189	10845
Aspirine	104	10933

Entrez les données suivantes dans Minitab :

C1	C2	C3
Groupe	Crise cardiaque	Dénombrement
Placebo	Oui	189
Placebo	Non	10845
Aspirine	Oui	104
Aspirine	Non	10933

Sélectionnez Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire.
Dans la zone Réponse, entrez C2 et dans la zone Effectif, entrez C3.
Dans la zone Prédicteurs de catégorie, saisissez C1. Cliquez sur OK.

Régression logistique binaire : Crise cardiaque en fonction de Groupe

Rapports des probabilités de succès pour les prédicteurs de catégorie Rapport des probabilités Niveau A Niveau B de succès IC à 95 % Groupe Placebo Aspirine 1,8321 (1,4400; 2,3308) Rapport des probabilités de succès pour le niveau A par rapport au niveau B

Le rapport des probabilités de succès est de 1,8321. Cela signifie que la probabilité d'avoir une crise cardiaque est 1,8321 fois plus élevée pour une personne prenant le placebo que pour une personne prenant de l'aspirine. Vous pouvez être sûr à 95 % que la valeur réelle du rapport des probabilités de succès est comprise entre 1,44 et 2,3308.

Les données utilisées dans cet exemple proviennent de la page 20 de l'ouvrage A. Agresti (1996). An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc.