Ejemplo de Regresión de cuadrados mínimos parciales con un conjunto de datos de prueba

Un científico que trabaja en un laboratorio de química de los alimentos analiza 60 muestras de harina de soya. Para cada muestra, el científico determina la humedad y contenido de grasa y registra datos del espectro infrarrojo cercano (NIR) a 88 longitudes de onda. El científico selecciona aleatoriamente 54 de las 60 muestras y estima la relación entre las respuestas (humedad y grasa) y los predictores (las 88 longitudes de onda NIR) usando la regresión PLS. El científico utiliza las 6 muestras restantes como un conjunto de datos de prueba para evaluar la capacidad predictiva del modelo.

  1. Abra los datos de muestra, HarinaSoya.MTW.
  2. Elija Estadísticas > Regresión > Mínimos cuadrados parciales.
  3. En Respuestas, ingrese Humedad Grasa.
  4. En Modelo, ingrese '1'-'88'.
  5. Haga clic en Predicción.
  6. En Nueva observación para predictores continuos, ingrese Prueba1-Prueba88.
  7. En Nueva observación para respuestas (opcional), ingrese Humedad2 Grasa2.
  8. Haga clic en Aceptar en cada cuadro de diálogo.

Interpretar los resultados

Los valores p para ambas respuestas son aproximadamente 0.000, que es menos que el nivel de significancia de 0.05. Estos resultados indican que al menos un coeficiente del modelo es diferente de cero. El valor del R2 de prueba para humedad es aproximadamente 0.9. El valor del R2 de prueba para grasa es casi 0.8. Los estadísticos R2 de prueba indican que los modelos predicen adecuadamente. El análisis de cada respuesta por separado daría resultados diferentes.

Regresión de PLS: Humedad, Grasa vs. 1, 2, 3, 4, 5, 6, 7, 8, ...

Método Validación cruzada Ninguno Componentes a calcular Conjunto Número de componentes calculados 10
Análisis de varianza de Humedad Fuente GL SC MC F P Regresión 10 468.516 46.8516 61.46 0.000 Error residual 43 32.777 0.7623 Total 53 501.293
Análisis de varianza de Grasa Fuente GL SC MC F P Regresión 10 266.378 26.6378 36.89 0.000 Error residual 43 31.050 0.7221 Total 53 297.428
Selección y validación de modelo para Humedad Varianza Componentes de X Error R-cuad. 1 0.984976 96.9288 0.806643 2 0.996400 88.9900 0.822479 3 0.997757 71.9304 0.856510 4 0.999427 58.3174 0.883666 5 0.999722 58.1261 0.884048 6 0.999853 48.5236 0.903203 7 0.999963 45.9824 0.908272 8 0.999976 33.1545 0.933862 9 0.999982 32.8074 0.934554 10 0.999986 32.7773 0.934615
Selección y validación de modelo para Grasa Varianza Componentes de X Error R-cuad. 1 0.984976 282.519 0.050127 2 0.996400 229.964 0.226824 3 0.997757 115.951 0.610155 4 0.999427 98.285 0.669550 5 0.999722 57.994 0.805015 6 0.999853 53.097 0.821480 7 0.999963 52.010 0.825133 8 0.999976 48.842 0.835784 9 0.999982 34.344 0.884529 10 0.999986 31.050 0.895604
Respuesta pronosticada para las nuevas observaciones utilizando modelo para Humedad Fila Ajuste EE de ajuste IC de 95% IP de 95% 1 14.5184 0.388841 (13.7343, 15.3026) (12.5910, 16.4459) 2 9.3049 0.372712 ( 8.5532, 10.0565) ( 7.3904, 11.2193) 3 14.1790 0.504606 (13.1614, 15.1966) (12.1454, 16.2127) 4 16.4477 0.559704 (15.3189, 17.5764) (14.3562, 18.5391) 5 15.1872 0.358044 (14.4652, 15.9093) (13.2842, 17.0903) 6 9.4639 0.485613 ( 8.4846, 10.4433) ( 7.4492, 11.4787) R-cuad. de prueba: 0.906451
Respuesta pronosticada para las nuevas observaciones utilizando modelo para Grasa Fila Ajuste EE de ajuste IC de 95% IP de 95% 1 18.7372 0.378459 (17.9740, 19.5004) (16.8612, 20.6132) 2 15.3782 0.362762 (14.6466, 16.1098) (13.5149, 17.2415) 3 20.7838 0.491134 (19.7933, 21.7743) (18.8044, 22.7632) 4 14.3684 0.544761 (13.2698, 15.4670) (12.3328, 16.4040) 5 16.6016 0.348485 (15.8988, 17.3044) (14.7494, 18.4538) 6 20.7471 0.472648 (19.7939, 21.7003) (18.7861, 22.7080) R-cuad. de prueba: 0.762701