Interpretar todos los estadísticos y gráficas para Análisis de correspondencia múltiple

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos y gráficas que se proporcionan con el análisis de correspondencia múltiple.

Eje

Minitab calcula cada eje principal, que también se denomina componente principal. Minitab ordena los componentes principales según la proporción de la inercia total que representan. El primer componente (eje) principal representa la mayor parte de la inercia. El segundo componente (eje) principal representa la mayor parte de la inercia restante, y así sucesivamente.

Interpretación

Utilice los ejes principales para evaluar qué componentes representan la mayor parte de la variabilidad en los datos.

Análisis de la matriz de indicadores

EjeInerciaProporciónAcumuladaHistograma
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
Total1.0000     

Estos resultados muestran la descomposición de la inercia total en 4 componentes. La inercia total explicada por los cuatro componentes es 1.000. De la inercia total, el primer componente representa el 40.32% de la inercia y el segundo componente representa el 25.20% de la inercia. Juntos, estos 2 componentes representan el 65.52% de la inercia total. Por lo tanto, especificar 2 componentes para el análisis pudiera no ser suficiente. Al agregar un tercer componente, la proporción acumulada de inercia aumenta a 84.51%.

Inercia

La inercia de un componente describe la cantidad de variación que el componente explica. La inercia de una columna describe qué tanto difieren los valores de esa categoría con respecto al valor esperado bajo el supuesto de que ninguna de las variables categóricas está correlacionada. Para calcular la inercia de un componente, Minitab multiplica la inercia de cada categoría por la correlación de la categoría para dicho componente y luego suma los productos resultantes.

Interpretación

Utilice la inercia de los componentes para determinar los componentes que representan la mayor parte de la variabilidad en los datos.

Análisis de la matriz de indicadores

EjeInerciaProporciónAcumuladaHistograma
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
Total1.0000     

Estos resultados muestran la descomposición de la inercia total en 4 componentes. La inercia total explicada por los cuatro componentes es 1.000. De la inercia total, el primer componente (eje) representa el 40.32% de la inercia y el segundo componente representa el 25.20% de la inercia. Juntos, estos 2 componentes representan el 65.52% de la inercia total. Por lo tanto, especificar 2 componentes para el análisis pudiera no ser suficiente. Al agregar un tercer componente, la proporción acumulada de inercia aumenta a 84.51%.

Utilice la inercia de las columnas para determinar qué categorías son las menos comunes bajo el supuesto de que ninguna de las variables categóricas está correlacionada. Para las inercias de las columnas, las diferencias con respecto a (1/número de categorías) indican las categorías menos comunes.

Contribuciones de columnas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Pequeño0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2Estándar0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3SinEyección0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4Eyección0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5Colisión0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6Volcamiento0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7NoSevero0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8Severo0.56800.11470.13530.76920.50180.16840.27950.06630.0356

En la tabla Contribuciones de columnas, la columna con el nombre Inercia es la proporción de la inercia total aportada por cada categoría. Por lo tanto, Eyección se desvía más de su valor esperado y aporta el 21.3% al estadístico total de chi-cuadrada.

Proporción, proporción acumulada e histograma

La proporción indica la proporción de la inercia total (la inercia explicada por todos los componentes) que explica cada componente (eje) principal. Minitab muestra los componentes en el orden de sus proporciones, de mayor a menor. Cada proporción se representa visualmente en el histograma.

La proporción acumulada indica la suma acumulada de las proporciones a medida que se agregan componentes (ejes).

Interpretación

Utilice la proporción y la proporción acumulada como ayuda para determinar cuántos componentes son suficientes para explicar la mayor parte de la inercia total. Lo ideal es que dos o tres componentes representen la mayor parte de la inercia total y sean más importantes que los otros componentes.

Análisis de la matriz de indicadores

EjeInerciaProporciónAcumuladaHistograma
10.40320.40320.4032******************************
20.25200.25200.6552******************
30.18990.18990.8451**************
40.15490.15491.0000***********
Total1.0000     

Estos resultados muestran la descomposición de la inercia total en 4 componentes. La inercia total explicada por los cuatro componentes es 1.000. De la inercia total, el primer componente (eje) representa el 40.32% de la inercia y el segundo componente representa el 25.20% de la inercia. Juntos, estos 2 componentes representan el 65.52% de la inercia total. Por lo tanto, especificar 2 componentes para el análisis pudiera no ser suficiente. Al agregar un tercer componente, la proporción acumulada de inercia aumenta a 84.51%.

Cal

Calidad (Cal) es la distancia al cuadrado del punto desde el origen en el número elegido de dimensiones dividida entre la distancia al cuadrado desde el origen en el espacio definido por el número máximo de dimensiones. Minitab calcula un valor de calidad para cada categoría.

Interpretación

Utilice los valores de calidad para determinar la proporción de inercia representada por los componentes para cada categoría. La calidad siempre es un número entre 0 y 1. Valores más grandes de calidad indican que la categoría está representada adecuadamente por los componentes. Valores más bajos indican una representación más deficiente. Los valores de calidad ayudan a interpretar los componentes.

Utilice los valores de contribución de las columnas para evaluar cuáles son las categorías que más contribuyen a la inercia de cada componente.

Contribuciones de columnas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Pequeño0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2Estándar0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3SinEyección0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4Eyección0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5Colisión0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6Volcamiento0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7NoSevero0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8Severo0.56800.11470.13530.76920.50180.16840.27950.06630.0356

En este análisis, Minitab calcula dos componentes principales para los datos relacionados con accidentes automovilísticos. En la tabla Contribuciones de columna, los valores más altos de calidad corresponden a los tamaños de vehículo Pequeño (0.965) y Estándar (0.965). Por lo tanto, estas dos categorías son las mejor representadas por los dos componentes. Eyección del conductor tiene la representación más deficiente, con un valor de calidad de 0.474 tanto para Eyección como para SinEyección. Volcamiento (0,291) y Eyección (0,250) son los que más contribuyen a la inercia del Componente 1. Los tamaños de vehículo Pequeño (0,771) y Estándar (0,158) son los que más contribuyen a la inercia del Componente 2. Sin embargo, estos resultados deben interpretarse con cuidado, ya que dos componentes pudieran no explicar adecuadamente la variabilidad de estos datos.

Total

Total es el total de la matriz de frecuencias relativas de cada categoría. El total de una columna es la suma de todas las frecuencias de la columna dividida entre la suma de todas las frecuencias.

Interpretación

Utilice el total para determinar la proporción de cada categoría de columna. Valores más grandes del total indican que la categoría de columna tiene una frecuencia relativa más alta. El total general de todas las categorías de columna es igual a 1 (100%).

Contribuciones de columnas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Pequeño0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2Estándar0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3SinEyección0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4Eyección0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5Colisión0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6Volcamiento0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7NoSevero0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8Severo0.56800.11470.13530.76920.50180.16840.27950.06630.0356

Esta tabla Contribuciones de columna evalúa las categorías de columna relacionadas con accidentes automovilísticos. La categoría SinEyección tiene el total más alto (0.213) y representa el 21.3% de los datos. La categoría Eyección tiene el total más bajo (0.037) y representa el 3.7% de los datos. Por lo tanto, para estos datos, los accidentes en los que el conductor es expulsado del vehículo son relativamente raros, mientras que los accidentes sin eyección del conductor son más comunes.

Coord

Minitab calcula las coordenadas principales de columna (Coord) para cada componente. Las coordenadas principales de columna son las coordenadas que se muestran en la gráfica de columnas.

Para mostrar visualmente los puntos definidos por las coordenadas principales de columna, utilice la gráfica de columnas.

Corr

El valor de la columna de correlación representa la contribución del componente a la inercia de la columna. Los valores de correlación van de 0 a 1.

Interpretación

Utilice el valor de correlación para interpretar cada componente en términos de su contribución a la inercia de columna. Los valores cercanos a 1 indican que el componente representa una alta cantidad de la inercia. Los valores cercanos a 0 indican que el componente contribuye poco a la inercia.

Contribuciones de columnas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Pequeño0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2Estándar0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3SinEyección0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4Eyección0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5Colisión0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6Volcamiento0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7NoSevero0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8Severo0.56800.11470.13530.76920.50180.16840.27950.06630.0356

Esta tabla Contribuciones de columna evalúa las categorías de columna relacionadas con accidentes automovilísticos. El Componente 1 representa la mayor parte de la inercia de Tipo de accidente (Corr = 0.610 para Colisión y Volcamiento), pero explica poco de la inercia de Tamaño del vehículo (Corr = 0.030 para Pequeño y Estándar).

Contr

La contribución (Contr) de cada categoría de columna a la inercia de cada componente.

Interpretación

Utilice los valores de contribución de las categorías de columna para interpretar los componentes.

Contribuciones de columnas






Componente 1Componente 2
IDNombreCalTotalInerciaCoordCorrContrCoordCorrContr
1Pequeño0.96550.04240.20760.38140.02970.0153-2.13940.93570.7707
2Estándar0.96550.20760.0424-0.07800.02970.00310.43740.93570.1576
3SinEyección0.47390.21340.0366-0.28440.47170.0428-0.01970.00230.0003
4Eyección0.47390.03660.21341.65870.47170.24970.11510.00230.0019
5Colisión0.61330.19260.0574-0.42640.60950.08680.03380.00380.0009
6Volcamiento0.61330.05740.19261.42940.60950.2911-0.11330.00380.0029
7NoSevero0.56800.13530.1147-0.65230.50180.1428-0.23710.06630.0302
8Severo0.56800.11470.13530.76920.50180.16840.27950.06630.0356

Esta tabla Contribuciones de columna evalúa las categorías de columna relacionadas con accidentes automovilísticos. Eyección (Contr = 0.250) y Volcamiento (Contr = 0.291) contribuyen más a la inercia del Componente 1. Los tamaños de vehículo Pequeño (Contr = 0.771) y Estándar (Contr = 0.158) contribuyen más a la inercia del Componente 2.

Gráfica de columnas

La gráfica de columnas muestra las coordenadas principales para las categorías de columna. Minitab grafica los puntos de columna con cuadrados azules, utilizando cuadrados completos para los puntos regulares y cuadrados abiertos para los puntos complementarios.
Nota

Por opción predeterminada, Minitab muestra los puntos de los dos primeros componentes principales, que representan la mayor cantidad de inercia total. Para mostrar otros componentes (ejes) principales en la gráfica, haga clic en Gráficas e ingrese los números de componente cuando realice el análisis.

Interpretación

Utilice la gráfica de columnas para buscar relaciones entre las categorías de columna y como ayuda para interpretar los componentes principales en relación con las categorías de columna. Los puntos que están más lejos del origen indican categorías que son más influyentes. Los puntos situados en los lados opuestos de la gráfica indican que un componente contrasta estas categorías.

En esta gráfica de columnas, Eyección y Volcamiento son los más distantes del origen en el eje horizontal para el componente 1. Esto concuerda con la contribución (Contr) relativamente alta de estas categorías para el componente 1. Puesto que Eyección y SinEyección, así como Severo y NoSevero, están en lados opuestos del origen, el componente 1 contrasta estos valores de categoría. El Componente 2 se muestra en el eje vertical. El tamaño de vehículo Pequeño se encuentra lejos de las otras categorías en un lado del eje vertical. Por lo tanto, el componente 2 contrasta el tamaño de vehículo Pequeño con las otras categorías.

Tabla de indicadores

La tabla de indicadores muestra todas las observaciones de los datos en forma de variables indicadoras. Cada variable indicadora (columna) representa un nivel de la variable categórica y cada observación (fila) toma un valor binario, dependiendo de si pertenece (1) o no pertenece (0) a la categoría. Por lo tanto, los valores de todas las columnas deben ser 0 o 1.

Para incluir la tabla de indicadores en los resultados, debe hacer clic en Resultados y seleccionar la opción para mostrar la tabla cuando realice el análisis.

En esta tabla de indicadores, la primera observación de la fila 1 indica un hombre de peso normal que fuma y tiene una actividad física regular. La segunda observación de la fila 2 indica una mujer con sobrepeso normal que no fuma y tiene una actividad física regular.
C1 C2 C3 C4 C5 C6 C7 C8 C8
Hombre Mujer Peso normal Bajo peso Sobrepeso Fuma No fuma Actividad Sin actividad
1 0 1 0 0 1 0 1 0
0 1 0 0 1 0 1 1 0
0 1 1 0 0 0 1 0 1
1 0 1 0 0 0 1 1 0
0 1 0 1 0 0 1 0 1
0 1 0 0 1 1 0 0 1

Tabla de Burt

La tabla de Burt es una matriz simétrica que se utiliza como ayuda para visualizar y analizar las relaciones entre las variables categóricas. Para incluir la tabla de indicadores en los resultados, debe hacer clic en Resultados y seleccionar la opción para mostrar la tabla cuando realice el análisis.

La tabla de Burt tiene una columna y una fila para cada nivel (categoría) de cada variable categórica. Por ejemplo, si los datos se dividen en 3 variables categóricas, tales como Sexo (hombre, mujer), Nivel de actividad (ligero, moderado, alto) y Edad (<20, 20-50, >50), la tabla de Burt tiene 2 + 3 + 3 = 8 filas y 8 columnas.
  Hombre Mujer Ligero Moderado Alto <20 20-50 >50
Hombre 87 0 33 45 9 26 47 14
Mujer 0 163 27 111 25 43 89 31
Ligero 33 27 60 0 0 14 48 7
Moderado 45 111 0 111 0 14 107 18
Alto 9 25 0 0 79 9 30 3
<20 26 43 14 14 9 37 0 0
20-50 47 89 48 107 30 0 185 0
>50 14 31 7 18 3 0 0 28

Cada entrada de la tabla de Burt muestra el número de observaciones que satisfacen las categorías en la columna y fila correspondiente. Por ejemplo, la entrada en la fila 1 y columna 3 es el número de observaciones que corresponden a hombre y actividad moderada (33). La entrada en la fila 1 y columna 2 es el número de observaciones que corresponden a hombre y mujer (0).

Puede determinar el número total de observaciones para cada categoría en las entradas diagonales desde la parte superior izquierda hasta la parte inferior derecha, donde cada entrada tiene el mismo encabezado de columna y fila. Por ejemplo, la entrada en la fila 1 y columna 1 muestra el número total de Hombres (87), la entrada en la fila 2 y columna 2 muestra el número total de Mujeres (163), y así sucesivamente.