Qu'est-ce qu'un tableau de contingence ?

Un tableau de contingence trie à plat les observations en fonction de plusieurs variables de catégorie. Les lignes et les colonnes du tableau correspondent à ces variables de catégorie.

Par exemple, après une récente élection opposant deux candidats, un sondage a enregistré le sexe et le vote de 100 électeurs choisis de façon aléatoire, et les données obtenues ont été organisées en tableau, comme suit :

Candidat A Candidat B Total
Homme 28 20 48
Femme 39 13 52
Total 67 33 100

Ce tableau de contingence trie à plat les réponses en fonction du sexe et du vote. Le dénombrement à l'intersection de la ligne i et de la colonne j est noté nij et désigne le nombre d'observations qui présentent cette combinaison de niveaux. Par exemple, n1,2 indique le nombre de répondants de sexe masculin qui ont voté pour le candidat B.

Le tableau comprend également les totaux marginaux de chaque niveau des variables. Les totaux marginaux des lignes indiquent que 52 répondants sont de sexe féminin. Les totaux marginaux des colonnes indiquent que 67 répondants ont voté pour le candidat A. En outre, le total général indique que l'effectif de l'échantillon est de 100.

Les tableaux de contingence peuvent également mettre en évidence les associations entre les deux variables. Utilisez un test du Khi deux ou un test exact de Fisher pour déterminer si les dénombrements observés diffèrent de manière significative des dénombrements attendus dans le cas de l'hypothèse nulle d'absence d'association. Par exemple, vous pouvez déterminer si une association existe entre le sexe et le vote.

Les tableaux de contingence les plus simples sont des tableaux à deux entrées qui trient à plat les réponses en fonction de deux variables. Vous pouvez classer les observations en fonction de trois variables (ou plus) en "croisant" ces dernières. Dans l'exemple du vote ci-dessus, vous pouvez affiner le classement des réponses en fonction de la situation d'emploi :

  Candidat A Candidat B Total
Individu de sexe masculin/salarié 18 19 37
Individu de sexe masculin/chômeur 10 1 11
Individu de sexe féminin/salarié 33 10 43
Individu de sexe féminin/chômeur 6 3 9
Total 67 33 100

L'analyse des correspondances simples peut détecter, dans les tableaux de contingence, les associations dont le classement des données repose sur trois variables (ou plus). Pour effectuer une analyse des correspondances simples dans Minitab, sélectionnez Stat > Multivariée > Analyse des correspondances simples.

Calculer le rapport des probabilités de succès et l'intervalle de confiance d'un tableau de contingence 2 x 2

Vous pouvez utiliser Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire pour calculer le rapport des probabilités de succès et l'intervalle de confiance.

Par exemple, vous étudiez la relation entre la consommation d'aspirine et les crises cardiaques, et souhaitez calculer le rapport des probabilités de succès et son intervalle de confiance à partir du tableau de contingence 2 x 2 suivant :
  Crise cardiaque Pas de crise cardiaque
Placebo 189 10845
Aspirine 104 10933
  1. Entrez les données suivantes dans Minitab :
    C1 C2 C3
    Groupe Crise cardiaque Dénombrement
    Placebo Oui 189
    Placebo Non 10845
    Aspirine Oui 104
    Aspirine Non 10933
  2. Sélectionnez Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire.
  3. Dans la zone Réponse, entrez C2 et dans la zone Effectif, entrez C3.
  4. Dans la zone Prédicteurs de catégorie, saisissez C1. Cliquez sur OK.

Régression logistique binaire : Crise cardiaque en fonction de Groupe

Rapports des probabilités de succès pour les prédicteurs de catégorie Rapport des probabilités Niveau A Niveau B de succès IC à 95 % Groupe Placebo Aspirine 1,8321 (1,4400; 2,3308) Rapport des probabilités de succès pour le niveau A par rapport au niveau B

Le rapport des probabilités de succès est de 1,8321. Cela signifie que la probabilité d'avoir une crise cardiaque est 1,8321 fois plus élevée pour une personne prenant le placebo que pour une personne prenant de l'aspirine. Vous pouvez être sûr à 95 % que la valeur réelle du rapport des probabilités de succès est comprise entre 1,44 et 2,3308.

Les données utilisées dans cet exemple proviennent de la page 20 de l'ouvrage A. Agresti (1996). An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc.