Frecuencias y distancias de chi-cuadrada para Análisis de correspondencia simple

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos que se proporcionan en relación con las frecuencias y las distancias de chi-cuadrada para el análisis de correspondencia simple.

Tabla de contingencia

La tabla de contingencia cuenta las observaciones de acuerdo con múltiples variables categóricas. Las filas y columnas de la tabla corresponden a las variables categóricas. La tabla incluye los totales marginales para cada nivel de las variables.

La tabla de contingencia para el análisis de correspondencia simple es una tabla de dos factores que cuenta las observaciones de dos variables. También se pueden categorizar las observaciones de tres o cuatro variables usando el cuadro de diálogo secundario Combinar para cruzar las variables y crear las filas y/o columnas de una tabla de dos factores.

Interpretación

Utilice la tabla de contingencia para ver la frecuencia observada de cada celda definida por una categoría de fila y una categoría de columna. Use los totales de columna y fila para ver la frecuencia total de cada categoría.

Tabla de contingencia

ABCDETotal
Geología3.00019.00039.00014.00010.00085.000
Bioquímica1.0002.00013.0001.00012.00029.000
Química6.00025.00049.00021.00029.000130.000
Zoología3.00015.00041.00035.00026.000120.000
Física10.00022.00047.0009.00026.000114.000
Ingeniería3.00011.00025.00015.00034.00088.000
Microbiología1.0006.00014.0005.00011.00037.000
Botánica0.00012.00034.00017.00023.00086.000
Estadística2.0005.00011.0004.0007.00029.000
Matemáticas2.00011.00037.0008.00020.00078.000
Total31.000128.000310.000129.000198.000796.000

En la siguiente tabla de contingencia de dos factores se muestran los conteos observados de investigadores en cada disciplina académica y categoría de financiamiento (A, B, C, D, E). La columna Total indica que la mayoría de los investigadores se encuentran en los campos de Química (130), Zoología (120) y Física (114). La fila Total indica que la mayoría de los investigadores están clasificados en la categoría de financiamiento C (310). Para los conteos de celda, los investigadores de Química que se clasifican en la categoría de financiamiento C tienen la frecuencia observada más alta (49).

Frecuencias esperadas

La frecuencia esperada es el conteo de observaciones que se espera en una celda, en promedio, si las variables son independientes. Minitab calcula los conteos esperados como el producto de los totales de fila y columna, dividido entre el número total de observaciones.

Frecuencias esperadas

ABCDE
Geología3.31013.66833.10313.77521.143
Bioquímica1.1294.66311.2944.7007.214
Química5.06320.90550.62821.06832.337
Zoología4.67319.29646.73419.44729.849
Física4.44018.33244.39718.47528.357
Ingeniería3.42714.15134.27114.26121.889
Microbiología1.4415.95014.4105.9969.204
Botánica3.34913.82933.49213.93721.392
Estadística1.1294.66311.2944.7007.214
Matemáticas3.03812.54330.37712.64119.402

La siguiente tabla de frecuencias esperadas muestra los conteos esperados de los investigadores en cada disciplina académica y categoría de financiamiento (A, B, C, D, E), suponiendo que la relación entre financiamiento y disciplina académica es independiente. Puesto que la mayoría de los investigadores está en Química y la mayoría de las disciplinas está en la categoría de financiamiento C, la combinación de esas categorías tiene el valor esperado más alto (aproximadamente 51).

Frecuencias observadas – esperadas

La frecuencia observada − esperada es la diferencia entre el conteo de observaciones reales en la celda y el conteo de observaciones en la celda que se esperaría si las variables fueran independientes.

Interpretación

Utilice la diferencia entre las frecuencias observadas y esperadas para buscar evidencia de posibles asociaciones en los datos. Si dos variables están asociadas, entonces la distribución de las observaciones de una variable difiere dependiendo de la categoría de la segunda variable. Como resultado, la magnitud de la diferencia entre la frecuencia observada y la frecuencia esperada es relativamente grande. Si las dos variables son independientes, entonces la distribución de las observaciones de una variable es similar para todas las categorías de la segunda variable. Como resultado, la magnitud de la diferencia entre la frecuencia observada y la frecuencia esperada es relativamente pequeña.

Frecuencias observadas - esperadas

ABCDE
Geología-0.3105.3325.8970.225-11.143
Bioquímica-0.129-2.6631.706-3.7004.786
Química0.9374.095-1.628-0.068-3.337
Zoología-1.673-4.296-5.73415.553-3.849
Física5.5603.6682.603-9.475-2.357
Ingeniería-0.427-3.151-9.2710.73912.111
Microbiología-0.4410.050-0.410-0.9961.796
Botánica-3.349-1.8290.5083.0631.608
Estadística0.8710.337-0.294-0.700-0.214
Matemáticas-1.038-1.5436.623-4.6410.598

En esta tabla, la magnitud de la diferencia entre el conteo observado y el conteo esperado es relativamente grande para Zoología y la categoría de financiamiento D (15.553) y para Ingeniería y la categoría de financiamiento E (12.111). Para estas celdas, los conteos observados son mayores que el conteo que se podría esperar si las variables fueran independientes. La magnitud de la diferencia también es relativamente grande para Geología y la categoría de financiamiento E (-11.143). Para esta celda, el conteo observado es menor que el conteo que se podría esperar si las variables fueran independientes. Por lo tanto, se puede concluir que un número de departamentos de Ingeniería considerablemente mayor de lo esperado no recibió financiamiento y que un número de departamentos de Geología considerablemente menor de lo esperado no recibió financiamiento.

Distancias de chi-cuadrada

Minitab muestra la contribución de cada celda al estadístico de chi-cuadrada como la distancia de chi-cuadrada. La distancia de chi-cuadrada de cada celda cuantifica qué tanto del estadístico total de chi-cuadrada es atribuible a la divergencia de cada celda.

Minitab calcula la contribución de cada celda al estadístico de chi-cuadrada como el cuadrado de la diferencia entre los valores observados y esperados para una celda, dividido entre el valor esperado para esa celda. La chi-cuadrada total es la suma de los valores de todas las celdas.

Interpretación

Usted puede comparar las distancias de chi-cuadrada de cada celda para evaluar cuáles celdas contribuyen más a la chi-cuadrada total. Si las frecuencias de celda observadas y esperadas son muy diferentes, el valor de chi-cuadrada de la celda es más grande. Por lo tanto, una mayor distancia de chi-cuadrada en una celda sugiere una asociación entre las categorías de fila y columna más fuerte de lo que se esperaría en virtud de las probabilidades.

Distancias de Chi-cuadrada

ABCDETotal
Geología0.0292.0801.0500.0045.8739.036
Bioquímica0.0151.5210.2582.9133.1767.882
Química0.1730.8020.0520.0000.3441.373
Zoología0.5990.9570.70312.4380.49615.194
Física6.9640.7340.1534.8590.19612.906
Ingeniería0.0530.7022.5080.0386.70010.001
Microbiología0.1350.0000.0120.1660.3510.663
Botánica3.3490.2420.0080.6730.1214.393
Estadística0.6710.0240.0080.1040.0060.814
Matemáticas0.3540.1901.4441.7040.0183.710
Total12.3437.2526.19622.89917.28265.972

En esta tabla, la celda de Zoología y la categoría de financiamiento D es 12.438, que representa la contribución más grande a la chi-cuadrada total (65.972). De las categorías de fila, Zoología (15.194), Física (12.906) e Ingeniería (10.001) son las que más contribuyen a la chi-cuadrada total. De las categorías de columna, los niveles de financiamiento D (22.899) y E (17.282) son los que más contribuyen a la chi-cuadrada total.

Inercias relativas

La inercia de celda es el valor de chi-cuadrada de la celda dividido entre la frecuencia total de la tabla de contingencia. La suma de todas las inercias de celda es la inercia total, o simplemente la inercia. La inercia relativa de una celda es la inercia de celda dividida entre la inercia total. La inercia relativa de una fila es la suma de las inercias de celda de la fila dividida entre la inercia total. La inercia relativa de una columna es la suma de las inercias de celda de la columna dividida entre la inercia total.

Interpretación

Utilice la inercia relativa para evaluar la fuerza de las asociaciones entre las categorías y las contribuciones a la variación en los datos. Valores más altos generalmente indican una asociación más fuerte y una mayor proporción de la variabilidad total con respecto a los valores esperados de los datos.

Inercias relativas

ABCDETotal
Geología0.0000.0320.0160.0000.0890.137
Bioquímica0.0000.0230.0040.0440.0480.119
Química0.0030.0120.0010.0000.0050.021
Zoología0.0090.0150.0110.1890.0080.230
Física0.1060.0110.0020.0740.0030.196
Ingeniería0.0010.0110.0380.0010.1020.152
Microbiología0.0020.0000.0000.0030.0050.010
Botánica0.0510.0040.0000.0100.0020.067
Estadística0.0100.0000.0000.0020.0000.012
Matemáticas0.0050.0030.0220.0260.0000.056
Total0.1870.1100.0940.3470.2621.000

La tabla Inercias relativas muestra la contribución relativa de cada celda al estadístico total de chi-cuadrada. Cuanto mayor sea la inercia relativa en una celda, mayor será la asociación entre las categorías de fila y columna. En esta tabla, la celda de Zoología y la categoría de financiamiento D tienen la inercia relativa más alta (0.189), que es la asociación más fuerte en la tabla. La tabla también indica la inercia relativa total de cada fila y columna.