Frecuencias y distancias de chi-cuadrada para Análisis de correspondencia simple

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos que se proporcionan en relación con las frecuencias y las distancias de chi-cuadrada para el análisis de correspondencia simple.

Tabla de contingencia

La tabla de contingencia cuenta las observaciones de acuerdo con múltiples variables categóricas. Las filas y columnas de la tabla corresponden a las variables categóricas. La tabla incluye los totales marginales para cada nivel de las variables.

La tabla de contingencia para el análisis de correspondencia simple es una tabla de dos factores que cuenta las observaciones de dos variables. También se pueden categorizar las observaciones de tres o cuatro variables usando el cuadro de diálogo secundario Combine para cruzar las variables y crear las filas y/o columnas de una tabla de dos factores.

Interpretación

Utilice la tabla de contingencia para ver la frecuencia observada de cada celda definida por una categoría de fila y una categoría de columna. Use los totales de columna y fila para ver la frecuencia total de cada categoría.

Tabla de contingencia A B C D E Total Geología 3.000 19.000 39.000 14.000 10.000 85.000 Bioquímica 1.000 2.000 13.000 1.000 12.000 29.000 Química 6.000 25.000 49.000 21.000 29.000 130.000 Zoología 3.000 15.000 41.000 35.000 26.000 120.000 Física 10.000 22.000 47.000 9.000 26.000 114.000 Ingeniería 3.000 11.000 25.000 15.000 34.000 88.000 Microbiología 1.000 6.000 14.000 5.000 11.000 37.000 Botánica 0.000 12.000 34.000 17.000 23.000 86.000 Estadística 2.000 5.000 11.000 4.000 7.000 29.000 Matemática 2.000 11.000 37.000 8.000 20.000 78.000 Total 31.000 128.000 310.000 129.000 198.000 796.000

En la siguiente tabla de contingencia de dos factores se muestran los conteos observados de investigadores en cada disciplina académica y categoría de financiamiento (A, B, C, D, E). La columna Total indica que la mayoría de los investigadores se encuentran en los campos de Química (130), Zoología (120) y Física (114). La fila Total indica que la mayoría de los investigadores están clasificados en la categoría de financiamiento C (310). Para los conteos de celda, los investigadores de Química que se clasifican en la categoría de financiamiento C tienen la frecuencia observada más alta (49).

Frecuencias esperadas

La frecuencia esperada es el conteo de observaciones que se espera en una celda, en promedio, si las variables son independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.

Frecuencias esperadas A B C D E Geología 3.310 13.668 33.103 13.775 21.143 Bioquímica 1.129 4.663 11.294 4.700 7.214 Química 5.063 20.905 50.628 21.068 32.337 Zoología 4.673 19.296 46.734 19.447 29.849 Física 4.440 18.332 44.397 18.475 28.357 Ingeniería 3.427 14.151 34.271 14.261 21.889 Microbiología 1.441 5.950 14.410 5.996 9.204 Botánica 3.349 13.829 33.492 13.937 21.392 Estadística 1.129 4.663 11.294 4.700 7.214 Matemática 3.038 12.543 30.377 12.641 19.402

La siguiente tabla de frecuencias esperadas muestra los conteos esperados de los investigadores en cada disciplina académica y categoría de financiamiento (A, B, C, D, E), suponiendo que la relación entre financiamiento y disciplina académica es independiente. Puesto que la mayoría de los investigadores está en Química y la mayoría de las disciplinas está en la categoría de financiamiento C, la combinación de esas categorías tiene el valor esperado más alto (aproximadamente 51).

Frecuencias observadas – esperadas

La frecuencia observada − esperada es la diferencia entre el conteo de observaciones reales en la celda y el conteo de observaciones en la celda que se esperaría si las variables fueran independientes.

Interpretación

Utilice la diferencia entre las frecuencias observadas y esperadas para buscar evidencia de posibles asociaciones en los datos. Si dos variables están asociadas, entonces la distribución de las observaciones de una variable difiere dependiendo de la categoría de la segunda variable. Como resultado, la magnitud de la diferencia entre la frecuencia observada y la frecuencia esperada es relativamente grande. Si las dos variables son independientes, entonces la distribución de las observaciones de una variable es similar para todas las categorías de la segunda variable. Como resultado, la magnitud de la diferencia entre la frecuencia observada y la frecuencia esperada es relativamente pequeña.

Frecuencias observadas - esperadas A B C D E Geología -0.310 5.332 5.897 0.225 -11.143 Bioquímica -0.129 -2.663 1.706 -3.700 4.786 Química 0.937 4.095 -1.628 -0.068 -3.337 Zoología -1.673 -4.296 -5.734 15.553 -3.849 Física 5.560 3.668 2.603 -9.475 -2.357 Ingeniería -0.427 -3.151 -9.271 0.739 12.111 Microbiología -0.441 0.050 -0.410 -0.996 1.796 Botánica -3.349 -1.829 0.508 3.063 1.608 Estadística 0.871 0.337 -0.294 -0.700 -0.214 Matemática -1.038 -1.543 6.623 -4.641 0.598

En esta tabla, la magnitud de la diferencia entre el conteo observado y el conteo esperado es relativamente grande para Zoología y la categoría de financiamiento D (15.553) y para Ingeniería y la categoría de financiamiento E (12.111). Para estas celdas, los conteos observados son mayores que el conteo que se podría esperar si las variables fueran independientes. La magnitud de la diferencia también es relativamente grande para Geología y la categoría de financiamiento E (-11.143). Para esta celda, el conteo observado es menor que el conteo que se podría esperar si las variables fueran independientes. Por lo tanto, se puede concluir que un número de departamentos de Ingeniería considerablemente mayor de lo esperado no recibió financiamiento y que un número de departamentos de Geología considerablemente menor de lo esperado no recibió financiamiento.

Distancias de chi-cuadrada

Minitab muestra la contribución de cada celda al estadístico de chi-cuadrada como la distancia de chi-cuadrada. La distancia de chi-cuadrada de cada celda cuantifica qué tanto del estadístico total de chi-cuadrada es atribuible a la divergencia de cada celda.

Minitab calcula la contribución de cada celda al estadístico de chi-cuadrada como el cuadrado de la diferencia entre los valores observados y esperados para una celda, dividido entre el valor esperado para esa celda. La chi-cuadrada total es la suma de los valores de todas las celdas.

Interpretación

Usted puede comparar las distancias de chi-cuadrada de cada celda para evaluar cuáles celdas contribuyen más a la chi-cuadrada total. Si las frecuencias de celda observadas y esperadas son muy diferentes, el valor de chi-cuadrada de la celda es más grande. Por lo tanto, una mayor distancia de chi-cuadrada en una celda sugiere una asociación entre las categorías de fila y columna más fuerte de lo que se esperaría en virtud de las probabilidades.

Distancias de Chi-cuadrada A B C D E Total Geología 0.029 2.080 1.050 0.004 5.873 9.036 Bioquímica 0.015 1.521 0.258 2.913 3.176 7.882 Química 0.173 0.802 0.052 0.000 0.344 1.373 Zoología 0.599 0.957 0.703 12.438 0.496 15.194 Física 6.964 0.734 0.153 4.859 0.196 12.906 Ingeniería 0.053 0.702 2.508 0.038 6.700 10.001 Microbiología 0.135 0.000 0.012 0.166 0.351 0.663 Botánica 3.349 0.242 0.008 0.673 0.121 4.393 Estadística 0.671 0.024 0.008 0.104 0.006 0.814 Matemática 0.354 0.190 1.444 1.704 0.018 3.710 Total 12.343 7.252 6.196 22.899 17.282 65.972

En esta tabla, la celda de Zoología y la categoría de financiamiento D es 12.438, que representa la contribución más grande a la chi-cuadrada total (65.972). De las categorías de fila, Zoología (15.194), Física (12.906) e Ingeniería (10.001) son las que más contribuyen a la chi-cuadrada total. De las categorías de columna, los niveles de financiamiento D (22.899) y E (17.282) son los que más contribuyen a la chi-cuadrada total.

Inercias relativas

La inercia de celda es el valor de chi-cuadrada de la celda dividido entre la frecuencia total de la tabla de contingencia. La suma de todas las inercias de celda es la inercia total, o simplemente la inercia. La inercia relativa de una celda es la inercia de celda dividida entre la inercia total. La inercia relativa de una fila es la suma de las inercias de celda de la fila dividida entre la inercia total. La inercia relativa de una columna es la suma de las inercias de celda de la columna dividida entre la inercia total.

Interpretación

Utilice la inercia relativa para evaluar la fuerza de las asociaciones entre las categorías y las contribuciones a la variación en los datos. Valores más altos generalmente indican una asociación más fuerte y una mayor proporción de la variabilidad total con respecto a los valores esperados de los datos.

Inercias relativas A B C D E Total Geología 0.000 0.032 0.016 0.000 0.089 0.137 Bioquímica 0.000 0.023 0.004 0.044 0.048 0.119 Química 0.003 0.012 0.001 0.000 0.005 0.021 Zoología 0.009 0.015 0.011 0.189 0.008 0.230 Física 0.106 0.011 0.002 0.074 0.003 0.196 Ingeniería 0.001 0.011 0.038 0.001 0.102 0.152 Microbiología 0.002 0.000 0.000 0.003 0.005 0.010 Botánica 0.051 0.004 0.000 0.010 0.002 0.067 Estadística 0.010 0.000 0.000 0.002 0.000 0.012 Matemática 0.005 0.003 0.022 0.026 0.000 0.056 Total 0.187 0.110 0.094 0.347 0.262 1.000

La tabla Inercias relativas muestra la contribución relativa de cada celda al estadístico total de chi-cuadrada. Cuanto mayor sea la inercia relativa en una celda, mayor será la asociación entre las categorías de fila y columna. En esta tabla, la celda de Zoología y la categoría de financiamiento D tienen la inercia relativa más alta (0.189), que es la asociación más fuerte en la tabla. La tabla también indica la inercia relativa total de cada fila y columna.

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política