O que é uma tabela de contingência?

A tabela de contingência é a tabela que calcula observações por múltiplas variáveis categóricas. As linhas e colunas das tabelas correspondem a essas variáveis categóricas.

Por exemplo, após uma eleição recente entre dois candidatos, uma pesquisa de boca de urna registrou o gênero e o voto de 100 eleitores aleatórios e tabulou os dados conforme mostrado abaixo:

Candidato A Candidato B Todos
Masculino 28 20 48
Feminino 39 13 52
Todos 67 33 100

Esta tabela de contingência correlaciona as respostas por gênero e voto. A contagem na intersecção da linha i e coluna j é identificada por nij, e representa o número de observações que exibem essa combinação de níveis. Por exemplo, n1,2 exibe o número de entrevistados do sexo masculino que tenham votado para o Candidato B.

A tabela também inclui totais marginais para cada nível das variáveis. Os totais marginais para as linhas mostram que 52 dos entrevistados eram do sexo feminino. Os totais marginais para colunas mostram que 67 entrevistados votaram no Candidato A. Além disso, o total global mostra que o tamanho amostral é de 100.

As tabelas de contingência também podem revelar associação entre as duas variáveis. Use um teste qui-quadrado ou teste exato de Fisher para determinar se as contagens observadas diferem significativamente das contagens esperadas sob a hipótese nula de não associação. Por exemplo, você pode testar se existe uma associação entre gênero e voto.

As tabelas de contingência mais simples são tabelas com dois fatores que contam as respostas por duas variáveis. Você pode categorizar observações por três ou mais variáveis "cruzando-as". No exemplo do voto, você também poderia classificar as respostas por situação empregatícia:

  Candidato A Candidato B Total
Homem / empregado 18 19 37
Homem / desempregado 10 1 11
Mulher / empregada 33 10 43
Mulher / desempregada 6 3 9
Total 67 33 100

Uma análise de correspondência simples pode detectar associações em tabelas de contingência que categorizam dados por mais de duas variáveis. Para executar uma análise de correspondência simples no Minitab, selecione Estat > Multivariada > Análise de correspondência simples.

Calcule a razão de chances e o intervalo de confiança para uma tabela de contingência 2 X 2

É possível usar Estat > Regressão > Regressão logística binária > Ajustar modelo logístico binário para calcular a razão de chances e o intervalo de confiança.

Por exemplo, você está investigando a relação entre o uso de aspirina e ataques cardíacos, e deseja calcular a razão de chances e o intervalo de confiança para a razão de chances para a seguinte tabela de contingência 2 X 2:
  Ataque Cardíaco Nenhum Ataque Cardíaco
Placebo 189 10845
Aspirina 104 10933
  1. Digite os seguintes dados no Minitab:
    C1 C2 C3
    Grupo Ataque Cardíaco Contagem
    Placebo Sim 189
    Placebo Não 10845
    Aspirina Sim 104
    Aspirina Não 10933
  2. Selecione Estat > Regressão > Regressão logística binária > Ajustar modelo logístico binário.
  3. Em Resposta, insira C2 e em Frequência, insira C3.
  4. Em Preditores categóricos, insira C1. Clique em OK.

Regressão Logística Binária: Ataque Cardíaco versus Grupo

Razões de Chances para Preditores Categóricos Razão de Nível A Nível B Chances IC de 95% Grupo Placebo Aspirina 1,8321 (1,4400; 2,3308) Razão de chances para o nível A em relação ao nível B

A razão de chances é 1,8321. Isto significa que uma pessoa tomando o placebo tem chances 1,8321 vezes maior de ter um ataque cardíaco do que uma pessoa que toma aspirina. Você pode ter 95% de certeza de que o verdadeiro valor para a razão de chances está entre 1,44 e 2,3308.

Os dados usados neste exemplo estão na página 20 de A. Agresti (1996). An Introduction to Categorical Data Analysis. An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc.