La tabla de contingencia cuenta las observaciones de acuerdo con múltiples variables categóricas. Las filas y columnas de la tabla corresponden a las variables categóricas. La tabla incluye los totales marginales para cada nivel de las variables.
La tabla de contingencia para el análisis de correspondencia simple es una tabla de dos factores que cuenta las observaciones de dos variables. También se pueden categorizar las observaciones de tres o cuatro variables usando el cuadro de diálogo secundario Combinar para cruzar las variables y crear las filas y/o columnas de una tabla de dos factores.
Utilice la tabla de contingencia para ver la frecuencia observada de cada celda definida por una categoría de fila y una categoría de columna. Use los totales de columna y fila para ver la frecuencia total de cada categoría.
A | B | C | D | E | Total | |
---|---|---|---|---|---|---|
Geología | 3.000 | 19.000 | 39.000 | 14.000 | 10.000 | 85.000 |
Bioquímica | 1.000 | 2.000 | 13.000 | 1.000 | 12.000 | 29.000 |
Química | 6.000 | 25.000 | 49.000 | 21.000 | 29.000 | 130.000 |
Zoología | 3.000 | 15.000 | 41.000 | 35.000 | 26.000 | 120.000 |
Física | 10.000 | 22.000 | 47.000 | 9.000 | 26.000 | 114.000 |
Ingeniería | 3.000 | 11.000 | 25.000 | 15.000 | 34.000 | 88.000 |
Microbiología | 1.000 | 6.000 | 14.000 | 5.000 | 11.000 | 37.000 |
Botánica | 0.000 | 12.000 | 34.000 | 17.000 | 23.000 | 86.000 |
Estadística | 2.000 | 5.000 | 11.000 | 4.000 | 7.000 | 29.000 |
Matemáticas | 2.000 | 11.000 | 37.000 | 8.000 | 20.000 | 78.000 |
Total | 31.000 | 128.000 | 310.000 | 129.000 | 198.000 | 796.000 |
En la siguiente tabla de contingencia de dos factores se muestran los conteos observados de investigadores en cada disciplina académica y categoría de financiamiento (A, B, C, D, E). La columna Total indica que la mayoría de los investigadores se encuentran en los campos de Química (130), Zoología (120) y Física (114). La fila Total indica que la mayoría de los investigadores están clasificados en la categoría de financiamiento C (310). Para los conteos de celda, los investigadores de Química que se clasifican en la categoría de financiamiento C tienen la frecuencia observada más alta (49).
La frecuencia esperada es el conteo de observaciones que se espera en una celda, en promedio, si las variables son independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.
A | B | C | D | E | |
---|---|---|---|---|---|
Geología | 3.310 | 13.668 | 33.103 | 13.775 | 21.143 |
Bioquímica | 1.129 | 4.663 | 11.294 | 4.700 | 7.214 |
Química | 5.063 | 20.905 | 50.628 | 21.068 | 32.337 |
Zoología | 4.673 | 19.296 | 46.734 | 19.447 | 29.849 |
Física | 4.440 | 18.332 | 44.397 | 18.475 | 28.357 |
Ingeniería | 3.427 | 14.151 | 34.271 | 14.261 | 21.889 |
Microbiología | 1.441 | 5.950 | 14.410 | 5.996 | 9.204 |
Botánica | 3.349 | 13.829 | 33.492 | 13.937 | 21.392 |
Estadística | 1.129 | 4.663 | 11.294 | 4.700 | 7.214 |
Matemáticas | 3.038 | 12.543 | 30.377 | 12.641 | 19.402 |
La siguiente tabla de frecuencias esperadas muestra los conteos esperados de los investigadores en cada disciplina académica y categoría de financiamiento (A, B, C, D, E), suponiendo que la relación entre financiamiento y disciplina académica es independiente. Puesto que la mayoría de los investigadores está en Química y la mayoría de las disciplinas está en la categoría de financiamiento C, la combinación de esas categorías tiene el valor esperado más alto (aproximadamente 51).
La frecuencia observada − esperada es la diferencia entre el conteo de observaciones reales en la celda y el conteo de observaciones en la celda que se esperaría si las variables fueran independientes.
Utilice la diferencia entre las frecuencias observadas y esperadas para buscar evidencia de posibles asociaciones en los datos. Si dos variables están asociadas, entonces la distribución de las observaciones de una variable difiere dependiendo de la categoría de la segunda variable. Como resultado, la magnitud de la diferencia entre la frecuencia observada y la frecuencia esperada es relativamente grande. Si las dos variables son independientes, entonces la distribución de las observaciones de una variable es similar para todas las categorías de la segunda variable. Como resultado, la magnitud de la diferencia entre la frecuencia observada y la frecuencia esperada es relativamente pequeña.
A | B | C | D | E | |
---|---|---|---|---|---|
Geología | -0.310 | 5.332 | 5.897 | 0.225 | -11.143 |
Bioquímica | -0.129 | -2.663 | 1.706 | -3.700 | 4.786 |
Química | 0.937 | 4.095 | -1.628 | -0.068 | -3.337 |
Zoología | -1.673 | -4.296 | -5.734 | 15.553 | -3.849 |
Física | 5.560 | 3.668 | 2.603 | -9.475 | -2.357 |
Ingeniería | -0.427 | -3.151 | -9.271 | 0.739 | 12.111 |
Microbiología | -0.441 | 0.050 | -0.410 | -0.996 | 1.796 |
Botánica | -3.349 | -1.829 | 0.508 | 3.063 | 1.608 |
Estadística | 0.871 | 0.337 | -0.294 | -0.700 | -0.214 |
Matemáticas | -1.038 | -1.543 | 6.623 | -4.641 | 0.598 |
En esta tabla, la magnitud de la diferencia entre el conteo observado y el conteo esperado es relativamente grande para Zoología y la categoría de financiamiento D (15.553) y para Ingeniería y la categoría de financiamiento E (12.111). Para estas celdas, los conteos observados son mayores que el conteo que se podría esperar si las variables fueran independientes. La magnitud de la diferencia también es relativamente grande para Geología y la categoría de financiamiento E (-11.143). Para esta celda, el conteo observado es menor que el conteo que se podría esperar si las variables fueran independientes. Por lo tanto, se puede concluir que un número de departamentos de Ingeniería considerablemente mayor de lo esperado no recibió financiamiento y que un número de departamentos de Geología considerablemente menor de lo esperado no recibió financiamiento.
Minitab muestra la contribución de cada celda al estadístico de chi-cuadrada como la distancia de chi-cuadrada. La distancia de chi-cuadrada de cada celda cuantifica qué tanto del estadístico total de chi-cuadrada es atribuible a la divergencia de cada celda.
Minitab calcula la contribución de cada celda al estadístico de chi-cuadrada como el cuadrado de la diferencia entre los valores observados y esperados para una celda, dividido entre el valor esperado para esa celda. La chi-cuadrada total es la suma de los valores de todas las celdas.
Usted puede comparar las distancias de chi-cuadrada de cada celda para evaluar cuáles celdas contribuyen más a la chi-cuadrada total. Si las frecuencias de celda observadas y esperadas son muy diferentes, el valor de chi-cuadrada de la celda es más grande. Por lo tanto, una mayor distancia de chi-cuadrada en una celda sugiere una asociación entre las categorías de fila y columna más fuerte de lo que se esperaría en virtud de las probabilidades.
A | B | C | D | E | Total | |
---|---|---|---|---|---|---|
Geología | 0.029 | 2.080 | 1.050 | 0.004 | 5.873 | 9.036 |
Bioquímica | 0.015 | 1.521 | 0.258 | 2.913 | 3.176 | 7.882 |
Química | 0.173 | 0.802 | 0.052 | 0.000 | 0.344 | 1.373 |
Zoología | 0.599 | 0.957 | 0.703 | 12.438 | 0.496 | 15.194 |
Física | 6.964 | 0.734 | 0.153 | 4.859 | 0.196 | 12.906 |
Ingeniería | 0.053 | 0.702 | 2.508 | 0.038 | 6.700 | 10.001 |
Microbiología | 0.135 | 0.000 | 0.012 | 0.166 | 0.351 | 0.663 |
Botánica | 3.349 | 0.242 | 0.008 | 0.673 | 0.121 | 4.393 |
Estadística | 0.671 | 0.024 | 0.008 | 0.104 | 0.006 | 0.814 |
Matemáticas | 0.354 | 0.190 | 1.444 | 1.704 | 0.018 | 3.710 |
Total | 12.343 | 7.252 | 6.196 | 22.899 | 17.282 | 65.972 |
En esta tabla, la celda de Zoología y la categoría de financiamiento D es 12.438, que representa la contribución más grande a la chi-cuadrada total (65.972). De las categorías de fila, Zoología (15.194), Física (12.906) e Ingeniería (10.001) son las que más contribuyen a la chi-cuadrada total. De las categorías de columna, los niveles de financiamiento D (22.899) y E (17.282) son los que más contribuyen a la chi-cuadrada total.
La inercia de celda es el valor de chi-cuadrada de la celda dividido entre la frecuencia total de la tabla de contingencia. La suma de todas las inercias de celda es la inercia total, o simplemente la inercia. La inercia relativa de una celda es la inercia de celda dividida entre la inercia total. La inercia relativa de una fila es la suma de las inercias de celda de la fila dividida entre la inercia total. La inercia relativa de una columna es la suma de las inercias de celda de la columna dividida entre la inercia total.
Utilice la inercia relativa para evaluar la fuerza de las asociaciones entre las categorías y las contribuciones a la variación en los datos. Valores más altos generalmente indican una asociación más fuerte y una mayor proporción de la variabilidad total con respecto a los valores esperados de los datos.
A | B | C | D | E | Total | |
---|---|---|---|---|---|---|
Geología | 0.000 | 0.032 | 0.016 | 0.000 | 0.089 | 0.137 |
Bioquímica | 0.000 | 0.023 | 0.004 | 0.044 | 0.048 | 0.119 |
Química | 0.003 | 0.012 | 0.001 | 0.000 | 0.005 | 0.021 |
Zoología | 0.009 | 0.015 | 0.011 | 0.189 | 0.008 | 0.230 |
Física | 0.106 | 0.011 | 0.002 | 0.074 | 0.003 | 0.196 |
Ingeniería | 0.001 | 0.011 | 0.038 | 0.001 | 0.102 | 0.152 |
Microbiología | 0.002 | 0.000 | 0.000 | 0.003 | 0.005 | 0.010 |
Botánica | 0.051 | 0.004 | 0.000 | 0.010 | 0.002 | 0.067 |
Estadística | 0.010 | 0.000 | 0.000 | 0.002 | 0.000 | 0.012 |
Matemáticas | 0.005 | 0.003 | 0.022 | 0.026 | 0.000 | 0.056 |
Total | 0.187 | 0.110 | 0.094 | 0.347 | 0.262 | 1.000 |
La tabla Inercias relativas muestra la contribución relativa de cada celda al estadístico total de chi-cuadrada. Cuanto mayor sea la inercia relativa en una celda, mayor será la asociación entre las categorías de fila y columna. En esta tabla, la celda de Zoología y la categoría de financiamiento D tienen la inercia relativa más alta (0.189), que es la asociación más fuerte en la tabla. La tabla también indica la inercia relativa total de cada fila y columna.