La validación cruzada calcula la capacidad predictiva de los posibles modelos para ayudar a determinar el número adecuado de componentes que se deben conservar en el modelo. La validación cruzada es la mejor opción si usted no sabe cuál es el número óptimo de componentes. Cuando los datos contienen múltiples variables de respuesta, Minitab valida los componentes para todas las respuestas de manera simultánea.
Después de realizar los pasos del 1 al 5 para cada modelo, Minitab selecciona el modelo con el número de componentes que produce el R2 pronosticado más alto y el PRESS más bajo. Con múltiples variables de respuesta, Minitab selecciona el modelo con el R2 pronosticado promedio más alto y el PRESS promedio más bajo.
Si usted no utiliza validación cruzada, Minitab establece el número de componentes en 10 o en el número de predictores del modelo, el que sea menor.
En la regresión PLS, el valor ajustado con validación cruzada es la respuesta pronosticada para cada observación del conjunto de datos, calculada individualmente, de manera que la observación pueda excluirse del modelo utilizado para calcular la respuesta pronosticada para esa observación. Los valores ajustados con validación cruzada se calculan durante la validación cruzada y varían según la cantidad de observaciones que se omiten cada vez que se vuelve a calcular el modelo.
Utilice los valores ajustados con validación cruzada para determinar qué tan bien son pronosticados los datos por el modelo. Los valores ajustados con validación cruzada son similares a los valores ajustados ordinarios, que indican qué tan bien se ajusta el modelo a los datos.
En la regresión PLS, los residuos con validación cruzada son las diferencias entre las respuestas reales y los valores ajustados con validación cruzada. El valor del residuo con validación cruzada varía según la cantidad de observaciones que se omiten cada vez que se vuelve a calcular el modelo durante la validación cruzada.
Los residuos miden la capacidad de predicción del modelo. Minitab utiliza los residuos con validación cruzada para calcular el estadístico PRESS.