Métodos y fórmulas para la selección del modelo en Regresión de cuadrados mínimos parciales

Seleccione el método o la fórmula de su preferencia.

R-cuad.

El R2 también es denominado como el coeficiente de determinación.

Fórmula

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
i iésima respuesta ajustada

SC

La suma de las distancias elevadas al cuadrado. La SC de regresión es la porción de la variación explicada por el modelo. La SC del error es la porción no explicada por el modelo y se atribuye al error. La SC total es la variación total en los datos.

Fórmula

SC de regresión:
SC del error:
SC total:

Notación

TérminoDescription
yi valor de la iésimath respuesta observada
iésima respuesta ajustada
respuesta media

PRESS

El estadístico Suma de los cuadrados de predicción (PRESS) evalúa la capacidad predictiva del modelo. El PRESS, que es similar a la suma de los cuadrados de los residuos, es la suma de los cuadrados del error de predicción. En PLS, Minitab solo calcula el PRESS si usted aplicó validación cruzada al modelo.

Minitab calcula el PRESS utilizando los siguientes pasos:

  1. Minitab vuelve a calcular el modelo tantas veces como el número de observaciones, omitiendo una observación diferente cada vez. Para cada observación omitida, Minitab calcula la respuesta ajustada o pronosticada usando el modelo.
  2. Minitab resta el valor pronosticado al valor de respuesta observado. Este es el error de predicción real, porque el ajuste de la observación es independiente del modelo.
  3. Una vez que Minitab realiza esta rutina para todas las observaciones, calcula el PRESS usando la fórmula:

En general, mientras más pequeño es el valor de PRESS, mejor será la capacidad predictiva del modelo. El PRESS se utiliza para calcular el R2 pronosticado.

Notación

TérminoDescription
yila respuesta observada
la respuesta ajustada para la observación omitida
nel número de observaciones

R-cuad.(pred)

Aunque los cálculos de R2(pred) pueden producir valores negativos, para estos casos Minitab muestra cero.

Notación

TérminoDescription
yi i ésimo valor de respuesta observado
respuesta media
n número de observaciones
ei i ésimo residuo
hi i ésimo elemento diagonal de X(X'X)–1X'
X matriz de diseño

R-cuad. de prueba

Indica la efectividad con la cual el modelo PLS predice los datos de prueba. El R2 de prueba representa la proporción de variación en las respuestas que es explicada por los predictores incluidos en el conjunto de datos. Por lo general, los datos de prueba se utilizan para validar el modelo ajustado y deben incluir el mismo número de predictores que el conjunto original de datos. El R2 de prueba solo se puede calcular si los datos de prueba incluyen datos de respuesta para cada observación. El R2 de prueba se calcula de la misma manera que el R2 con esta fórmula: