Ejemplo de Análisis de correspondencia simple

Un gerente de investigación universitaria desea determinar la forma cómo diez disciplinas académicas se comparan entre sí en relación con cinco diferentes categorías de fondos. El gerente recopila datos de clasificación de 2 factores de 796 investigadores.

Para esta clasificación de dos factores, las disciplinas académicas están en filas y las categorías de fondos están en columnas. A es la categoría de fondos más alta, D es la más baja y la categoría E no tiene fondos. El gerente realiza un análisis de correspondencia simple para representar las asociaciones entre las filas y columnas.

El gerente también desea examinar datos complementarios que no se incluyeron en el conjunto de datos principal. Los datos complementarios incluyen una fila adicional para los investigadores de museos y una fila para las ciencias matemáticas, que es la suma de matemáticas y estadística.

  1. Abra el conjunto de datos de muestra, FondosInvestigación.MTW.
  2. Elija Estadísticas > Análisis multivariado > Análisis de correspondencia simple.
  3. En Datos de ingreso, seleccione Columnas de una tabla de contingencia e ingrese CT1-CT5. En Nombres de filas, ingrese NombresFila. En Nombres de columnas, ingrese NombresCol.
  4. Haga clic en Resultados y seleccione Perfiles de filas. Haga clic en Aceptar.
  5. Haga clic en Datos suplementarios. En Filas complementarias, ingrese FilaCompl1FilaCompl2. En Nombres de filas, ingrese NombresFC. Haga clic en Aceptar.
  6. Haga clic en Gráficas. Seleccione Mostrar los puntos suplementarios en todas las gráficas. Seleccione Gráfica simétrica que muestra solo las filas y Gráfica de fila asimétrica que muestra las filas y las columnas.
  7. Haga clic en Aceptar en cada cuadro de diálogo.

Interpretar los resultados

La tabla Perfiles de fila muestra las proporciones de cada categoría de fila por columna. Por ejemplo, para Geología, el 3.5% de los investigadores se encuentra en la categoría de financiamiento A, el 22.4% está en la categoría de financiamiento B, y así sucesivamente. El total de cada fila indica la proporción de investigadores en todo el conjunto de datos. Por ejemplo, el total para Geología es 0.107, lo que indica que el 10.7% de los investigadores se encuentra en el campo Geología.

Puede utilizar los valores de las tablas Contribuciones de fila y Contribuciones de columna para interpretar los diferentes componentes. La columna con la etiqueta Cal, es decir, calidad, indica la proporción de la inercia representada por los dos componentes.

Por ejemplo, para las contribuciones de fila, Zoología (0.929) y Geología (0.916) son los campos mejor representados por el desglose de los dos componentes. Matemáticas tiene la peor representación, con un valor de calidad de 0.319. Para las contribuciones de columna, los dos componentes explican la mayor parte de la variabilidad en las categorías de financiamiento B, D y E. Las categorías con financiamiento A, B, C y D son las que más contribuyen al componente 1, mientras que la categoría sin financiamiento, E, es la que más contribuye al componente 2.

La gráfica de filas muestra las coordenadas principales de fila. El componente 1, que es el que explica mejor Física y Zoología, muestra estos dos campos más alejados del origen, pero con signo opuesto. Por lo tanto, el componente 1 contrasta las ciencias biológicas Zoología y Botánica con Física. El componente 2 contrasta Bioquímica e Ingeniería con Geología.

En la gráfica asimétrica de filas, la escala de las filas corresponde a las coordenadas principales y la escala de las columnas corresponde a las coordenadas estándar. Entre las categorías de financiamiento, el Componente 1 contrasta los niveles de financiamiento, mientras que el Componente 2 contrasta el recibir financiamiento (A hasta D) con el no recibir financiamiento (E). Entre las disciplinas, Física tiende a mostrar el nivel de financiamiento más alto y Zoología el más bajo. Bioquímica tiene a mostrar un nivel de financiamiento intermedio, pero el más elevado entre los investigadores que no reciben financiamiento. Los Museos tienden a recibir financiamiento, pero a un nivel más bajo que los investigadores académicos

Perfiles de filas

ABCDETotal
Geología0.0350.2240.4590.1650.1180.107
Bioquímica0.0340.0690.4480.0340.4140.036
Química0.0460.1920.3770.1620.2230.163
Zoología0.0250.1250.3420.2920.2170.151
Física0.0880.1930.4120.0790.2280.143
Ingeniería0.0340.1250.2840.1700.3860.111
Microbiología0.0270.1620.3780.1350.2970.046
Botánica0.0000.1400.3950.1980.2670.108
Estadística0.0690.1720.3790.1380.2410.036
Matemáticas0.0260.1410.4740.1030.2560.098
Total0.0390.1610.3890.1620.249 

La tabla de análisis de contingencia

EjeInerciaProporciónAcumulada
10.03910.47200.4720
20.03040.36660.8385
30.01090.13110.9697
40.00250.03031.0000
Total0.0829   

Contribuciones de las filas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Geología0.9160.1070.137-0.0760.0550.016-0.3030.8610.322
2Bioquímica0.8810.0360.119-0.1800.1190.0300.4550.7620.248
3Química0.6440.1630.021-0.0380.1340.006-0.0730.5100.029
4Zoología0.9290.1510.2300.3270.8460.413-0.1020.0830.052
5Física0.8860.1430.196-0.3160.8800.365-0.0270.0060.003
6Ingeniería0.8700.1110.1520.1170.1210.0390.2920.7490.310
7Microbiología0.6800.0460.010-0.0130.0090.0000.1100.6710.018
8Botánica0.6540.1080.0670.1790.6250.0880.0390.0290.005
9Estadística0.5610.0360.012-0.1250.5540.014-0.0140.0070.000
10Matemáticas0.3190.0980.056-0.1070.2400.0290.0610.0790.012

Filas complementarias






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Museos0.5560.0670.3530.3140.2250.168-0.3810.3310.318
2CienciaMat0.5590.1340.041-0.1120.4930.0430.0410.0660.007

Contribuciones de columnas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1A0.5870.0390.187-0.4780.5740.228-0.0720.0130.007
2B0.8160.1610.110-0.1270.2860.067-0.1730.5310.159
3C0.4650.3890.094-0.0830.3410.068-0.0500.1240.032
4D0.9680.1620.3470.3900.8590.632-0.1390.1090.103
5E0.9900.2490.2620.0320.0120.0060.2920.9780.699