Una tabla de contingencia es una tabla que cuenta las observaciones por múltiples variables categóricas. Las filas y columnas de las tablas corresponden a estas variables categóricas.
Por ejemplo, después de una elección reciente entre dos candidatos, una encuesta de salida registró el sexo y el voto de 100 electores seleccionados de manera aleatoria y los datos se tabularon de la siguiente manera:
Candidato A | Candidato B | Todo | |
---|---|---|---|
Hombre | 28 | 20 | 48 |
Mujer | 39 | 13 | 52 |
Todo | 67 | 33 | 100 |
Esta tabla de contingencia cuenta las respuestas según sexo y voto. El conteo en la intersección de la fila i y la columna j se denota como nij, y representa el número de observaciones que muestra esa combinación de niveles. Por ejemplo, n1,2 muestra el número de encuestados masculinos que votaron por el Candidato B.
La tabla también incluye los totales marginales para cada nivel de las variables. Los totales marginales para las filas muestran que 52 de los encuestados fueron mujeres. Los totales marginales para las columnas muestran que 67 encuestados votaron por el Candidato A. Además, el total general muestra que el tamaño de la muestra es 100.
Las tablas de contingencia también pueden revelar asociaciones entre las dos variables. Utilice una prueba de chi-cuadrada o una prueba exacta de Fisher para determinar si los conteos observados difieren significativamente de los conteos esperados bajo la hipótesis nula de que no existe asociación. Por ejemplo, usted podría probar si existe una asociación entre sexo y voto.
Las tablas de contingencia más simples son tablas de dos factores que cuentan las respuestas según dos variables. Usted puede categorizar las observaciones según tres o más variables al "cruzarlas". En el ejemplo de votación anterior, las respuestas también podrían clasificarse según el estatus de empleo de la manera siguiente:
Candidato A | Candidato B | Total | |
---|---|---|---|
Hombre / empleado | 18 | 19 | 37 |
Hombre / desempleado | 10 | 1 | 11 |
Mujer / empleada | 33 | 10 | 43 |
Mujer / desempleada | 6 | 3 | 9 |
Total | 67 | 33 | 100 |
Un análisis de correspondencia simple puede detectar asociaciones en las tablas de contingencia que categorizan los datos por más de dos variables. Para realizar un análisis de correspondencia simple en Minitab, elija
.Usted puede usar para calcular la relación de probabilidades y el intervalo de confianza.
Ataque al corazón | Sin ataque al corazón | |
---|---|---|
Placebo | 189 | 10845 |
Aspirina | 104 | 10933 |
C1 | C2 | C3 |
---|---|---|
Grupo | Ataque al corazón | Conteo |
Placebo | Sí | 189 |
Placebo | No | 10845 |
Aspirina | Sí | 104 |
Aspirina | No | 10933 |
La relación de probabilidades es 1,8321. Esto significa que una persona que tome el placebo tiene una probabilidad 1,8321 veces mayor de sufrir un ataque al corazón que una persona que tome aspirina. Usted puede estar 95% seguro de que el valor real de la relación de probabilidades está entre 1,44 y 2,3308.
Los datos usados en este ejemplo se tomaron de la página 20 de A. Agresti (1996). An Introduction to Categorical Data Analysis. John Wiley & Sons, Inc.