Interpretar los resultados clave para Análisis de correspondencia simple

Complete los siguientes pasos para interpretar un análisis de correspondencia simple. La salida clave incluye los componentes principales, la inercia, la proporción de inercia, la calidad, el total y varias gráficas.

Paso 1: Determinar el número de componentes principales

Utilice la proporción de inercia para determinar el mínimo número de componentes principales, también denominados ejes principales, que representan la mayor parte de la desviación de los valores esperados en los datos. Conserve los componentes principales que expliquen una proporción aceptable de la inercia total. El nivel aceptable depende de la aplicación específica. Lo ideal es que el primer componente o los dos o tres primeros componentes representen la mayor parte de la inercia total.

Si el mínimo número de componentes principales necesarios no coincide con el número de componentes que usted ingresó para el análisis, repita el análisis utilizando el número adecuado de componentes.

La tabla de análisis de contingencia

EjeInerciaProporciónAcumulada
10.03910.47200.4720
20.03040.36660.8385
30.01090.13110.9697
40.00250.03031.0000
Total0.0829   
Resultados clave: Ejes, proporción, proporción acumulada

Estos resultados muestran la descomposición de la inercia total de una tabla de contingencia de 10 x 5 en 4 componentes. La inercia total explicada por los cuatro componentes es 0,0829. De la inercia total, el primer componente representa el 47.2% de la inercia (Proporción = 0.4720) y el segundo componente representa el 36.66% de la inercia (Proporción = 0.3666). Juntos, estos 2 componentes representan el 83.85% de la inercia total (Acumulado = 0.8385). Por lo tanto, especificar 2 componentes para el análisis pudiera ser suficiente.

Paso 2: Interpretar los componentes principales

Utilice los valores de calidad para determinar la proporción de la inercia de fila o de la inercia de columna representada por los componentes. La calidad siempre es un número entre 0 y 1. Valores más grandes de calidad indican que la fila o columna está representada adecuadamente por los componentes. Valores más bajos indican una representación más deficiente. Los valores de calidad de las filas y columnas pueden ayudar a interpretar los componentes.

Utilice los valores de contribución de las filas y/o columnas para evaluar cuáles son las categorías de columna y fila que más contribuyen a la inercia de cada componente. Para interpretar visualmente los componentes, utilice una gráfica de filas o de columnas.

Contribuciones de las filas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Geología0.9160.1070.137-0.0760.0550.016-0.3030.8610.322
2Bioquímica0.8810.0360.119-0.1800.1190.0300.4550.7620.248
3Química0.6440.1630.021-0.0380.1340.006-0.0730.5100.029
4Zoología0.9290.1510.2300.3270.8460.413-0.1020.0830.052
5Física0.8860.1430.196-0.3160.8800.365-0.0270.0060.003
6Ingeniería0.8700.1110.1520.1170.1210.0390.2920.7490.310
7Microbiología0.6800.0460.010-0.0130.0090.0000.1100.6710.018
8Botánica0.6540.1080.0670.1790.6250.0880.0390.0290.005
9Estadística0.5610.0360.012-0.1250.5540.014-0.0140.0070.000
10Matemáticas0.3190.0980.056-0.1070.2400.0290.0610.0790.012
Resultados clave: Cal, Contr, gráfica de filas/columnas

En este análisis, Minitab calcula dos componentes principales. En la tabla Contribuciones de fila, los valores más altos de calidad corresponden a Zoología (0.929) y Geología (0.916). Por lo tanto, estas dos filas son las mejor representadas por los dos componentes. Matemáticas tiene la representación más deficiente, con un valor de calidad de 0.319.

Zoología (0.413) y Física (0.365) son las que más contribuyen a la inercia del componente 1. Geología (0.322), Ingeniería (0.310) y Bioquímica (0.248) contribuyen más a la inercia del componente 2.

La gráfica de filas muestra las coordenadas principales de fila. El componente 1, que es el que explica mejor Zoología y Física, muestra estos dos campos más alejados del origen, pero con signos opuestos. Por lo tanto, el componente 1 contrasta las ciencias biológicas Zoología y Botánica con Física. El componente 2 contrasta Bioquímica e Ingeniería con Geología.

Paso 3: Examinar las relaciones entre las categorías

Examine los valores calculados de inercia para las categorías de fila y columna y busque posibles asociaciones. Las categorías con las asociaciones más fuertes tienen un mayor valor de inercia, lo que indica que contribuyen más al valor total de chi-cuadrada.

También puede utilizar una gráfica asimétrica de filas o de columnas para examinar visualmente las posibles relaciones. En el caso de una gráfica de filas, cuanto más cerca esté un perfil de fila de un vértice de columna, más alto estará el perfil de fila con respecto a la categoría de columna. Para una gráfica de columnas, cuanto más cerca esté un perfil de columna de un vértice de fila, más alto estará el perfil de columna con respecto a la categoría de fila.

Contribuciones de las filas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Geología0.9160.1070.137-0.0760.0550.016-0.3030.8610.322
2Bioquímica0.8810.0360.119-0.1800.1190.0300.4550.7620.248
3Química0.6440.1630.021-0.0380.1340.006-0.0730.5100.029
4Zoología0.9290.1510.2300.3270.8460.413-0.1020.0830.052
5Física0.8860.1430.196-0.3160.8800.365-0.0270.0060.003
6Ingeniería0.8700.1110.1520.1170.1210.0390.2920.7490.310
7Microbiología0.6800.0460.010-0.0130.0090.0000.1100.6710.018
8Botánica0.6540.1080.0670.1790.6250.0880.0390.0290.005
9Estadística0.5610.0360.012-0.1250.5540.014-0.0140.0070.000
10Matemáticas0.3190.0980.056-0.1070.2400.0290.0610.0790.012
Resultados clave: Inercia, gráfica asimétrica de filas/columnas

En la tabla Contribuciones de fila, la columna con el nombre Inercia es la proporción de la inercia total aportada por cada fila. Por lo tanto, Geología aporta el 13.7% al estadístico total de chi-cuadrada. Zoología tiene el valor más alto de inercia (0.230). Por lo tanto, Zoología aporta el 23% al valor total de chi-cuadrada y tiene una asociación más fuerte con las categorías de columna (financiamiento) que con las otras categorías de fila.

En la gráfica asimétrica de filas, los puntos de fila representan las disciplinas académicas y los puntos de columna representan los niveles de financiamiento (A es el nivel más alto de financiamiento y D es el más bajo. E indica que no hay financiamiento). Bioquímica es la disciplina que está más cerca de la categoría de columna E, lo que implica que, en este estudio, la bioquímica como disciplina tiene el porcentaje más alto de investigadores que no reciben financiamiento.