Contribuciones de columna para Análisis de correspondencia múltiple

Coordenadas principales de columna

Los perfiles de columna se encuentran en un espacio c-dimensional. El conjunto completo de d ejes principales abarca este espacio. Supongamos que gj1, gj2, gj3, ..., gjd son las coordenadas del perfil de columna j en términos de los ejes principales. Estas coordenadas se llaman coordenadas principales de columna. La késima coordenada principal para el perfil de columna j es gjk.

Los primeros k ejes principales abarcan el mejor subespacio k-dimensional. Si proyectamos el perfil de columna j hacia el mejor subespacio k-dimensional, gj1,..., gjk son las coordenadas principales de columna del perfil en este subespacio.

Correlación

La correlación entre el perfil de columna i y el componente principal k se calcula de la siguiente manera:

Minitab calcula la inercia relativa para cada columna. La inercia absoluta es el producto de la inercia relativa y la inercia total.

La suma de las correlaciones de la columna j, para todos los componentes principales, es 1. La suma para las primeras k coordenadas principales es la calidad asociada con perfil de columna j y el mejor subespacio k-dimensional.

Notación

TérminoDescription
gjk késima coordenada principal para el perfil de columna j

Inercia e inercia de celda

La inercia de una celda se calcula de la siguiente manera:

La suma de todas las inercias de celda es la inercia total, a veces mencionada simplemente como la inercia, de la tabla.

La inercia relativa de una celda se calcula de la siguiente manera:

Ejes principales (componentes principales)

Los perfiles de columna se encuentran en un espacio c-dimensional. Los ejes principales, también denominados componentes principales, abarcan los subespacios dimensionales más bajos. El primer eje principal se elige como el vector en el espacio c-dimensional que representa la máxima cantidad de la inercia total. Por lo tanto, el primer eje principal abarca el mejor subespacio unidimensional (es decir, el más cercano a los perfiles usando una métrica adecuada). El segundo eje principal se elige como el vector en el espacio c-dimensional que representa la máxima cantidad de la inercia restante. Por lo tanto, los dos primeros ejes principales abarcan el mejor subespacio bidimensional. El tercer eje principal se elige como el vector en el espacio c-dimensional que representa la máxima cantidad de la inercia restante, después de la inercia representada por los dos primeros ejes principales. Por lo tanto, los tres primeros ejes principales abarcan el mejor subespacio tridimensional, y así sucesivamente.

Sea d = el menor de (r − 1) y (c − 1). Los perfiles de columna se encuentran en un subespacio d-dimensional del espacio c-dimensional completo (o equivalentemente del espacio r-dimensional completo). Por lo tanto, el número de ejes principales es d como máximo.

Calidad

La calidad asociada con el perfil de columna j y el mejor subespacio k-dimensional se calcula de la siguiente manera:

La calidad siempre es un número entre entre 0 y 1, donde los números más grandes indican una mejor aproximación.

Notación

TérminoDescription
gjk késima coordenada principal para el perfil de columna j

Contribución relativa a la inercia total

La suma de las inercias de celda en una columna es la contribución de la columna a la inercia total. La contribución relativa de una columna a la inercia total se calcula de la siguiente manera:

Contribuciones de columna

Cada columna contribuye a la inercia de cada eje. La contribución de la columna j al eje k, expresada como un porcentaje de la inercia del eje k, se calcula de la siguiente manera:

La suma de las contribuciones del eje principal k, para todas las columnas j, es 1.

Notación

TérminoDescription
gjk késima coordenada principal para el perfil de columna j

Total de columna

El total de la columna j se calcula de la siguiente manera:

El vector de totales de la columna c es igual al perfil promedio de la columna.

Coordenadas estandarizadas

Las coordenadas estandarizadas de columna para el componente k son las coordenadas principales del componente k dividido entre la raíz cuadrada de la késima inercia.