A tabela de contingência é a tabela que calcula observações por múltiplas variáveis categóricas. As linhas e colunas das tabelas correspondem a essas variáveis categóricas.
Por exemplo, após uma eleição recente entre dois candidatos, uma pesquisa de boca de urna registrou o gênero e o voto de 100 eleitores aleatórios e tabulou os dados conforme mostrado abaixo:
Candidato A | Candidato B | Todos | |
---|---|---|---|
Masculino | 28 | 20 | 48 |
Feminino | 39 | 13 | 52 |
Todos | 67 | 33 | 100 |
Esta tabela de contingência correlaciona as respostas por gênero e voto. A contagem na intersecção da linha i e coluna j é identificada por nij, e representa o número de observações que exibem essa combinação de níveis. Por exemplo, n1,2 exibe o número de entrevistados do sexo masculino que tenham votado para o Candidato B.
A tabela também inclui totais marginais para cada nível das variáveis. Os totais marginais para as linhas mostram que 52 dos entrevistados eram do sexo feminino. Os totais marginais para colunas mostram que 67 entrevistados votaram no Candidato A. Além disso, o total global mostra que o tamanho amostral é de 100.
As tabelas de contingência também podem revelar associação entre as duas variáveis. Use um teste qui-quadrado ou teste exato de Fisher para determinar se as contagens observadas diferem significativamente das contagens esperadas sob a hipótese nula de não associação. Por exemplo, você pode testar se existe uma associação entre gênero e voto.
As tabelas de contingência mais simples são tabelas com dois fatores que contam as respostas por duas variáveis. Você pode categorizar observações por três ou mais variáveis "cruzando-as". No exemplo do voto, você também poderia classificar as respostas por situação empregatícia:
Candidato A | Candidato B | Total | |
---|---|---|---|
Homem / empregado | 18 | 19 | 37 |
Homem / desempregado | 10 | 1 | 11 |
Mulher / empregada | 33 | 10 | 43 |
Mulher / desempregada | 6 | 3 | 9 |
Total | 67 | 33 | 100 |
Uma análise de correspondência simples pode detectar associações em tabelas de contingência que categorizam dados por mais de duas variáveis. Para executar uma análise de correspondência simples no Minitab, selecione
.É possível usar para calcular a razão de chances e o intervalo de confiança.
Ataque Cardíaco | Nenhum Ataque Cardíaco | |
---|---|---|
Placebo | 189 | 10845 |
Aspirina | 104 | 10933 |
C1 | C2 | C3 |
---|---|---|
Grupo | Ataque Cardíaco | Contagem |
Placebo | Sim | 189 |
Placebo | Não | 10845 |
Aspirina | Sim | 104 |
Aspirina | Não | 10933 |
A razão de chances é 1,8321. Isto significa que uma pessoa tomando o placebo tem chances 1,8321 vezes maior de ter um ataque cardíaco do que uma pessoa que toma aspirina. Você pode ter 95% de certeza de que o verdadeiro valor para a razão de chances está entre 1,44 e 2,3308.
Os dados usados neste exemplo estão na página 20 de A. Agresti (1996). An Introduction to Categorical Data Analysis. An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc.