Métodos para Regresión de cuadrados mínimos parciales

Seleccione el método de su preferencia.

Ajuste del modelo

Minitab utiliza el algoritmo iterativo no lineal de mínimos cuadrados parciales (NIPALS) desarrollado por Herman Wold1 para resolver problemas asociados con datos mal acondicionados. PLS reduce el número de predictores al extraer los componentes no correlacionados con base en la covarianza entre las variables predictoras y de respuesta. PLS es similar a la regresión de componentes principales y la regresión de Ridge, pero se calcula de manera diferente.

El algoritmo de PLS produce una secuencia de modelos, donde cada modelo consecutivo contiene un componente adicional. Los componentes se calculan uno a la vez, comenzando por la matriz de X y Y estandarizada. Los componentes subsiguientes se calculan a partir de la matriz de residuos de X y Y; las iteraciones se detienen al alcanzarse el número máximo de componentes o cuando los residuos de X se convierten en la matriz de ceros. Si el número de componentes es igual al número de predictores, el modelo PLS es igual al modelo de regresión de mínimos cuadrados. La validación cruzada se utiliza para identificar el número de componentes que minimiza el error de predicción.

PLS realiza la descomposición de predictores y respuestas al mismo tiempo. Después de que Minitab determina el número de componentes y calcula las influencias, calcula los coeficientes de regresión para cada predictor. Para obtener información más detallada sobre PLS y NIPALS, consulte 234.

Validación cruzada

Calcula la capacidad predictiva de los posibles modelos para ayudarle a determinar el número adecuado de componentes que debe conservar en su modelo. Cuando los datos contienen múltiples variables de respuesta, Minitab valida los componentes para todas las respuestas de manera simultánea.

Procedimiento de validación cruzada

Para cada modelo posible, Minitab:

  1. Omite una observación o grupo de observaciones, dependiendo del método de validación cruzada que se utilice.
  2. Vuelve a calcular el modelo sin la observación/grupo de observaciones.
  3. Predice la respuesta, o el valor ajustado con validación cruzada, para la observación/grupo de observaciones omitido utilizando el modelo recalculado y calcula el valor de residuo con validación cruzada.
  4. Repite los pasos del 1 al 3 hasta que todas las observaciones han sido omitidas y ajustadas.
  5. Calcula los valores de la suma de los cuadrados de predicción (PRESS) y R2 pronosticado.

Después de realizar los pasos del 1 al 5 para cada modelo, Minitab selecciona el modelo con el número de componentes que produce el R2 pronosticado más alto y el PRESS más bajo. Con múltiples variables de respuesta, Minitab selecciona el modelo con el R2 pronosticado promedio más alto y el PRESS promedio más bajo.

1 H. Wold (1975). "Soft Modeling by Latent Variables; the Nonlinear Iterative Partial Least Squares Approach," en Perspectives in Probability and Statistics, Papers in Honour of M.S. Bartlett, ed. J. Gani, Academic Press.
2 P. Geladi y B. Kowalski (1986). "Partial Least-Squares Regression: A Tutorial," Analytica Chimica Acta, 185, 1-17.
3 A. Hoskuldsson (1988). "PLS Regression Methods," Journal of Chemometrics, 2, 211-228.
4 A. Lorber, L. Wangen y B. Kowalski (1987). "A Theoretical Foundation for the PLS Algorithm," Journal of Chemometrics, 1, 19-31.