Estadísticos de X y Y para Regresión de cuadrados mínimos parciales

Encuentre definiciones y ayuda para interpretar cada estadístico incluido en la tabla Estadísticos de X y Y.

En este tema

Valores calculados de X
Influencias de X
Residuos de X
Puntuaciones de X
Varianza de X
Ponderaciones de X
Valores calculados de Y
Influencias de Y
Residuos de Y
Puntuaciones de Y

Valores calculados de X

Los valores calculados de X son combinaciones lineales de las puntuaciones de X. Los valores calculados de X contienen la varianza en los términos que es explicada por el modelo de regresión PLS. Las observaciones con valores calculados de X relativamente pequeños son valores atípicos en el espacio X y el modelo no los explica adecuadamente.

La matriz calculada de X, similar a la matriz original de X, es una matriz n x p, donde n = número de observaciones y p = número de términos. Los valores calculados de X están en la misma escala que los predictores.

Si el número de componentes es igual al número de términos, entonces el valor calculado de X es igual al valor original de X.

Influencias de X

Las influencias de X son los coeficientes lineales que vinculan los términos a las puntuaciones de X. Las influencias de X indican la importancia del término correspondiente para el componente m^ésimo. Las influencias de X, que son similares a los vectores propios en los análisis de los componentes principales, forman una matriz p x m, donde p = número de términos y m = número de componentes.

Residuos de X

Los residuos de X contienen la varianza en los predictores que no es explicada por el modelo de regresión PLS. Las observaciones con residuos de X relativamente grandes son valores atípicos en el espacio X, lo que indica que no son explicadas adecuadamente por el modelo.

Los residuos de X son las diferencias entre los valores reales de cada término y los valores calculados de X y están en la misma escala que los predictores originales. La matriz de residuos de X, similar a la matriz original de X, es una matriz n x p, donde n = número de observaciones y p = número de términos.

Puntuaciones de X

Las puntuaciones de X son combinaciones lineales de los términos incluidos en el modelo. Las puntuaciones de X, que son similares a las puntuaciones de componentes principales, forman una matriz n x m de columnas no correlacionadas, donde n = número de observaciones y m = número de componentes. Las puntuaciones de X son proyecciones de las observaciones en los componentes de la regresión PLS. La regresión PLS ajusta las puntuaciones de X, que reemplazan a los términos originales en el modelo, utilizando la estimación de mínimos cuadrados.

Varianza de X

La varianza de X es la cantidad de varianza en los términos que es explicada por el modelo. El valor de la varianza de X está entre 0 y 1

Mientras más cerca de 1 esté el valor de la varianza de X, mejor representarán los componentes al conjunto original de términos. Si tiene más de 1 respuesta, el valor de la varianza de X es igual para todas las respuestas.

Ponderaciones de X

Las ponderaciones de X describen la covarianza entre los predictores y las respuestas. En el algoritmo, las ponderaciones de X se utilizan para asegurar que las puntuaciones de X sean ortogonales, o no estén relacionadas entre sí. Las ponderaciones de X, que se utilizan para calcular las puntuaciones de X, forman una matriz p x m, donde p = número de términos y m = número de componentes.

Valores calculados de Y

Los valores calculados de Y son combinaciones lineales de las puntuaciones de X. Los valores calculados de Y contienen la varianza en las respuestas que es explicada por el modelo de regresión PLS. Las observaciones con valores calculados de Y relativamente pequeños son valores atípicos en el espacio Y no son explicadas adecuadamente.

La matriz calculada de Y, al igual que la matriz original de Y, es una matriz n x r, donde n = número de observaciones y r = número de respuestas. Los valores calculados de Y están en la misma escala que las respuestas.

Influencias de Y

Las influencias de Y son los coeficientes lineales que vinculan las respuestas a las puntuaciones de Y. Los valores de influencia de Y denotan la importancia de la respuesta correspondiente para el componente m^ésimo. Las influencias de Y forman una matriz r x m, donde r = número de respuestas y m = número de componentes.

Residuos de Y

Los residuos de Y contienen la varianza restante en las respuestas que no es explicada por el modelo de regresión PLS. Las observaciones con residuos de Y relativamente grandes son valores atípicos en el espacio Y, lo que indica que no son explicadas adecuadamente por el modelo.

Los residuos de Y son las diferencias entre los valores de respuesta reales y los valores calculados de Y, y se encuentran en la misma escala que las respuestas originales. La matriz de residuos de Y, similar a la matriz original de Y, es una matriz n x r, donde n = número de observaciones y r = número de respuestas.

Puntuaciones de Y

Las puntuaciones de Y son combinaciones lineales de las variables de respuesta. Las puntuaciones de Y forman una matriz n x m, donde n = número de observaciones y m = número de componentes. Las puntuaciones de Y son proyecciones de las observaciones en los componentes de la regresión PLS.