Ejemplo de Regresión de mínimos cuadrados parciales con validación cruzada

Un productor de vino desea saber cómo se relaciona la composición química de su vino con las evaluaciones sensoriales. Tiene 37 muestras de Pinot Noir, cada una descrita por 17 concentraciones de elementos (Cd, Mo, Mn, Ni, Cu, Al, Ba, Cr, Sr, Pb, B, Mg, Si, Na, Ca, P, K) y una puntuación del aroma del vino proporcionada por un panel de jueces. El productor quiere predecir la puntuación de aroma de los 17 elementos. Los datos provienen de: I.E. Frank y B.R. Kowalski (1984). "Prediction of Wine Quality and Geographic Origin from Chemical Measurements by Partial Least-Squares Regression Modeling," Analytica Chimica Acta , 162, 241 − 251.

El productor desea incluir en el modelo todas las concentraciones y todas las interacciones de 2 factores que incluyan el cadmio (Cd). Puesto que la relación de muestras a predictores es baja, el productor decide utilizar la regresión de mínimos cuadrados parciales.

  1. Abra los datos de muestra AromaVino.MTW.
  2. Elija Estadísticas > Regresión > Cuadrados mínimos parciales.
  3. En Respuestas, ingrese Aroma.
  4. En Modelo, ingrese Cd-K Cd*Mo Cd*Mn Cd*Ni Cd*Cu Cd*Al Cd*Ba Cd*Cr Cd*Sr Cd*Pb Cd*B Cd*Mg Cd*Si Cd*Na Cd*Ca Cd*P Cd*K.
  5. Haga clic en Opciones.
  6. En Validación cruzada, seleccione Dejar uno fuera. Haga clic en Aceptar.
  7. Haga clic en Gráficas. Seleccione Gráfica de selección de modelo. Desmarque Gráfica de respuesta y Gráfica de coeficientes.
  8. Haga clic en Aceptar en cada cuadro de diálogo.

Interpretar los resultados

La gráfica de selección del modelo identifica el modelo con 4 componentes como el modelo óptimo, porque el modelo de 4 componentes tiene el valor más alto de R2 pronosticado. Los valores de R2 pronosticados que aparecen en la gráfica se calculan con validación cruzada. La tabla Selección y validación del modelo muestra que el valor de R2 pronosticado para el modelo óptimo es aproximadamente 0.56. Minitab utiliza el modelo óptimo para los cálculos de análisis de varianza. El modelo óptimo es estadísticamente significativo en el nivel de significancia de 0.05, porque el valor p es aproximadamente 0.000.

Regresión de PLS: Aroma vs. Cd, Mo, Mn, Ni, Cu, Al, Ba, Cr, ...

Método Validación cruzada Dejar uno fuera Componentes a evaluar Conjunto Número de componentes evaluados 10 Número de componentes seleccionados 4
Análisis de varianza de Aroma Fuente GL SC MC F P Regresión 4 34.5514 8.63784 41.55 0.000 Error residual 32 6.6519 0.20787 Total 36 41.2032
Selección y validación de modelo para Aroma Varianza R-cuad. Componentes de X Error R-cuad. PRESS (pred.) 1 0.158849 14.9389 0.637435 23.3439 0.433444 2 0.442267 12.2966 0.701564 21.0936 0.488060 3 0.522977 7.9761 0.806420 19.6136 0.523978 4 0.594546 6.6519 0.838559 18.1683 0.559056 5 5.8530 0.857948 19.2675 0.532379 6 5.0123 0.878352 22.3739 0.456988 7 4.3109 0.895374 24.0041 0.417421 8 4.0866 0.900818 24.7736 0.398747 9 3.5886 0.912904 24.9090 0.395460 10 3.2750 0.920516 24.8293 0.397395
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política