Los valores propios (también llamados valores característicos o raíces latentes) son las varianzas de los componentes principales.
Usted puede utilizar el tamaño del valor propio para determinar el número de componentes principales. Conserve los componentes principales con los valores propios más grandes. Por ejemplo, según el criterio de Kaiser, se usan solo los componentes principales con valores propios que son mayores que 1.
Para comparar visualmente el tamaño de los valores propios, utilice la gráfica de sedimentación. La gráfica de sedimentación puede ayudarle a determinar el número de componentes con base en el tamaño de los valores propios.
Valor propio | 3.5476 | 2.1320 | 1.0447 | 0.5315 | 0.4112 | 0.1665 | 0.1254 | 0.0411 |
---|---|---|---|---|---|---|---|---|
Proporción | 0.443 | 0.266 | 0.131 | 0.066 | 0.051 | 0.021 | 0.016 | 0.005 |
Acumulada | 0.443 | 0.710 | 0.841 | 0.907 | 0.958 | 0.979 | 0.995 | 1.000 |
Variable | PC1 | PC2 | PC3 | PC4 | PC5 | PC6 | PC7 | PC8 |
---|---|---|---|---|---|---|---|---|
Ingresos | 0.314 | 0.145 | -0.676 | -0.347 | -0.241 | 0.494 | 0.018 | -0.030 |
Educación | 0.237 | 0.444 | -0.401 | 0.240 | 0.622 | -0.357 | 0.103 | 0.057 |
Edad | 0.484 | -0.135 | -0.004 | -0.212 | -0.175 | -0.487 | -0.657 | -0.052 |
Residencia | 0.466 | -0.277 | 0.091 | 0.116 | -0.035 | -0.085 | 0.487 | -0.662 |
Empleo | 0.459 | -0.304 | 0.122 | -0.017 | -0.014 | -0.023 | 0.368 | 0.739 |
Ahorros | 0.404 | 0.219 | 0.366 | 0.436 | 0.143 | 0.568 | -0.348 | -0.017 |
Deuda | -0.067 | -0.585 | -0.078 | -0.281 | 0.681 | 0.245 | -0.196 | -0.075 |
Tarj Crédito | -0.123 | -0.452 | -0.468 | 0.703 | -0.195 | -0.022 | -0.158 | 0.058 |
En estos resultados, los tres primeros componentes principales tienen valores propios mayores que 1. Estos tres componentes explican 84,1% de la variación en los datos. La gráfica de sedimentación muestra que los valores propios comienzan a formar una línea recta después del tercer componente principal. Si 84,1% es una cantidad adecuada de variación explicada en los datos, entonces debe utilizar los tres primeros componentes principales.
Proporción se refiere a la proporción de la variabilidad en los datos que explica cada componente principal.
Usted puede utilizar la proporción para determinar cuáles componentes principales explican la mayor parte de la variabilidad en los datos. Cuanto mayor sea la proporción, en mayor cantidad explicará ese componente principal la variabilidad. El tamaño de la proporción puede ayudarle a decidir si el componente principal es suficientemente importante para conservarlo.
Por ejemplo, un componente principal con una proporción de 0.621 explica 62.1% de la variabilidad en los datos. Por lo tanto, es importante incluir este componente. Otro componente tiene una proporción de 0.005, por lo que explica solo 0.5% de la variabilidad de los datos. Este componente pudiera no ser suficientemente importante para incluirse.
Acumulada se refiere a la proporción acumulada de la variabilidad de la muestra explicada por los componentes principales consecutivos.
Utilice la proporción acumulada para evaluar la cantidad total de varianza que explican los componentes principales consecutivos. La proporción acumulada puede ayudarle a determinar el número de componentes principales que se usará. Conserve los componentes principales que explican un nivel aceptable de varianza. El nivel aceptable depende de su aplicación.
Por ejemplo, probablemente solo se necesite que los componentes principales expliquen el 80% de la varianza si se utilizan solo para efectos descriptivos. Sin embargo, si usted desea realizar otros análisis en los datos, se recomienda que los componentes principales expliquen por lo menos 90% de la varianza.
Si utiliza la matriz de correlación, usted debe estandarizar las variables para obtener la puntuación correcta de los componentes.
Para interpretar cada componente principal, examine la magnitud y la dirección de los coeficientes de las variables originales. Cuanto mayor sea el valor absoluto del coeficiente, más importante será la variable correspondiente en el cálculo del componente. Qué tan grande debe ser el valor absoluto de un coeficiente para ser considerado importante es subjetivo. Utilice su conocimiento especializado para determinar en qué nivel el valor de correlación es importante.
Valor propio | 3.5476 | 2.1320 | 1.0447 | 0.5315 | 0.4112 | 0.1665 | 0.1254 | 0.0411 |
---|---|---|---|---|---|---|---|---|
Proporción | 0.443 | 0.266 | 0.131 | 0.066 | 0.051 | 0.021 | 0.016 | 0.005 |
Acumulada | 0.443 | 0.710 | 0.841 | 0.907 | 0.958 | 0.979 | 0.995 | 1.000 |
Variable | PC1 | PC2 | PC3 | PC4 | PC5 | PC6 | PC7 | PC8 |
---|---|---|---|---|---|---|---|---|
Ingresos | 0.314 | 0.145 | -0.676 | -0.347 | -0.241 | 0.494 | 0.018 | -0.030 |
Educación | 0.237 | 0.444 | -0.401 | 0.240 | 0.622 | -0.357 | 0.103 | 0.057 |
Edad | 0.484 | -0.135 | -0.004 | -0.212 | -0.175 | -0.487 | -0.657 | -0.052 |
Residencia | 0.466 | -0.277 | 0.091 | 0.116 | -0.035 | -0.085 | 0.487 | -0.662 |
Empleo | 0.459 | -0.304 | 0.122 | -0.017 | -0.014 | -0.023 | 0.368 | 0.739 |
Ahorros | 0.404 | 0.219 | 0.366 | 0.436 | 0.143 | 0.568 | -0.348 | -0.017 |
Deuda | -0.067 | -0.585 | -0.078 | -0.281 | 0.681 | 0.245 | -0.196 | -0.075 |
Tarj Crédito | -0.123 | -0.452 | -0.468 | 0.703 | -0.195 | -0.022 | -0.158 | 0.058 |
En estos resultados, el primer componente principal tiene asociaciones positivas grandes con Edad, Residencia, Empleo y Ahorros. Usted puede interpretar este componente principalmente como una medición de la estabilidad financiera a largo plazo de un solicitante. El segundo componente tiene asociaciones negativas grandes con Deudas y Tarj Crédito, así que este componente mide principalmente el historial crediticio de un solicitante. El tercer componente tiene asociaciones negativas grandes con ingresos, educación y tarj crédito, así que este componente mide principalmente las calificaciones académicas y de ingresos de un solicitante.
Las puntuaciones son combinaciones lineales de los datos que se determinan por los coeficientes de cada componente principal. Para obtener la puntuación de una observación, sustituya sus valores en la ecuación lineal del componente principal. Si utiliza la matriz de correlación, usted debe estandarizar las variables para obtener la puntuación correcta de los componentes cuando usa la ecuación lineal.
Para obtener la puntuación calculada de cada observación, haga clic en Almacenamiento e ingrese una columna para almacenar las puntuaciones en la hoja de trabajo cuando realiza el análisis. Para mostrar visualmente las puntuaciones del primero y del segundo componente en una gráfica, haga clic en Gráficas y seleccione la gráfica de puntuaciones cuando realiza el análisis.
Valor propio | 3.5476 | 2.1320 | 1.0447 | 0.5315 | 0.4112 | 0.1665 | 0.1254 | 0.0411 |
---|---|---|---|---|---|---|---|---|
Proporción | 0.443 | 0.266 | 0.131 | 0.066 | 0.051 | 0.021 | 0.016 | 0.005 |
Acumulada | 0.443 | 0.710 | 0.841 | 0.907 | 0.958 | 0.979 | 0.995 | 1.000 |
Variable | PC1 | PC2 | PC3 | PC4 | PC5 | PC6 | PC7 | PC8 |
---|---|---|---|---|---|---|---|---|
Ingresos | 0.314 | 0.145 | -0.676 | -0.347 | -0.241 | 0.494 | 0.018 | -0.030 |
Educación | 0.237 | 0.444 | -0.401 | 0.240 | 0.622 | -0.357 | 0.103 | 0.057 |
Edad | 0.484 | -0.135 | -0.004 | -0.212 | -0.175 | -0.487 | -0.657 | -0.052 |
Residencia | 0.466 | -0.277 | 0.091 | 0.116 | -0.035 | -0.085 | 0.487 | -0.662 |
Empleo | 0.459 | -0.304 | 0.122 | -0.017 | -0.014 | -0.023 | 0.368 | 0.739 |
Ahorros | 0.404 | 0.219 | 0.366 | 0.436 | 0.143 | 0.568 | -0.348 | -0.017 |
Deuda | -0.067 | -0.585 | -0.078 | -0.281 | 0.681 | 0.245 | -0.196 | -0.075 |
Tarj Crédito | -0.123 | -0.452 | -0.468 | 0.703 | -0.195 | -0.022 | -0.158 | 0.058 |
En estos resultados, la puntuación del primer componente principal se puede calcular a partir de los datos estandarizados utilizando los coeficientes indicados en PC1:
PC1 = 0.314 Ingresos + 0.237 Educación + 0.484 Edad + 0.466 Residencia + 0.459 Empleo + 0.404 Ahorros - 0.067 Deudas - 0.123 Tarj crédito
La distancia de Mahalanobis es la distancia entre un punto de los datos y el centroide de un espacio multivariado (la media general).
Para calcular la distancia de cada observación, haga clic en Almacenamiento e ingrese una columna en la hoja de trabajo para almacenar las distancias cuando realiza el análisis. Para mostrar las distancias en una gráfica, haga clic en Gráficas y seleccione la gráfica de valores atípicos cuando realiza el análisis.
Utilice la distancia de Mahalanobis para identificar valores atípicos. Examinar la distancia de Mahalanobis es un método multivariado más potente para detectar valores atípicos que examinar una variable a la vez, porque la distancia toma en cuenta las diferentes escalas entre las variables y las correlaciones entre estas.
Para evaluar si un valor de distancia es suficientemente grande para que la observación se considere un valor atípico, utilice la gráfica de valores atípicos.
La gráfica de sedimentación muestra el número del componente principal versus su valor propio correspondiente. La gráfica de sedimentación ordena los valores propios desde el más grande hasta el más pequeño. Los valores propios de la matriz de correlación son iguales a las varianzas de los componentes principales.
Para mostrar la gráfica de sedimentación, haga clic en Gráficas y seleccione la gráfica de sedimentación cuando realice el análisis.
La gráfica de puntuaciones representa visualmente las puntuaciones del segundo componente principal versus las puntuaciones del primer componente principal.
Para mostrar la gráfica de puntuaciones, haga clic en Gráficas y seleccione la gráfica de puntuaciones cuando realice el análisis.
Si los dos primeros componentes explican la mayor parte de la varianza en los datos, usted puede utilizar la gráfica de puntuaciones para evaluar la estructura de los datos y detectar conglomerados, valores atípicos y tendencias. Las agrupaciones de datos en la gráfica pudieran indicar dos o más distribuciones separadas en los datos. Si los datos siguen una distribución normal y no hay valores atípicos presentes, los puntos están distribuidos aleatoriamente alrededor de cero.
Para ver la puntuación calculada de cada observación, mantenga el cursor sobre un punto de los datos en la gráfica. Para crear gráficas de puntuaciones para otros componentes, almacene las puntuaciones y utilice
.La gráfica de influencias grafica los coeficientes de cada variable para el primer componente versus los coeficientes para el segundo componente. Los coeficientes son los valores que componen los vectores propios para cada componente principal. Los coeficientes indican la ponderación relativa de cada variable en el componente.
Para mostrar la gráfica de influencias, haga clic en Gráficas y seleccione la gráfica de influencias cuando realice el análisis.
Utilice la gráfica influencias para identificar cuáles variables tienen el mayor efecto en cada componente. Las influencias pueden ir de -1 a 1. Los coeficientes pueden oscilar entre -1 y 1. Los coeficientes cercanos a -1 o 1 indican que la variable influye fuertemente en el componente. Los coeficientes cercanos a 0 indican que la variable tiene una influencia débil en el componente. La evaluación de los coeficientes también puede ayudarle a caracterizar cada componente en términos de variables.
La gráfica de doble proyección sobrepone la gráfica de puntuaciones y la gráfica de influencias.
Para mostrar la gráfica de doble proyección, haga clic en Gráficas y seleccione la gráfica de doble proyección cuando realice el análisis.
Utilice la gráfica de doble proyección para evaluar la estructura de los datos y las influencias de los dos primeros componentes en una gráfica. Minitab grafica las puntuaciones del segundo componentes principal versus las puntuaciones del primer componente principal, así como las influencias de ambos componentes.
La gráfica de valores atípicos muestra la distancia de Mahalanobis para cada observación y una línea de referencia para identificar los valores atípicos. La distancia de Mahalanobis es la distancia entre cada punto de los datos y el centroide de un espacio multivariado (la media general). Examinar las distancias de Mahalanobis es un método más efectivo para detectar valores atípicos que examinar una variable a la vez, porque considera las diferentes escalas entre las variables y las correlaciones entre estas.
Para mostrar la gráfica de valores atípicos, debe hacer clic en Gráficas y seleccionar la gráfica de valores atípicos cuando realice el análisis.
Utilice la gráfica de valores atípicos para identificar valores atípicos. Cualquier punto que se encuentre por encima de la línea de referencia es un valor atípico.
Mantenga el cursor sobre cualquier punto en una gráfica de valores atípicos para identificar la observación. Utilice
para destacar múltiples valores atípicos en la gráfica y marcar las observaciones en la hoja de trabajo.