Ejemplo de Regresión de cuadrados mínimos parciales con un conjunto de datos de prueba

Un científico que trabaja en un laboratorio de química de los alimentos analiza 60 muestras de harina de soya. Para cada muestra, el científico determina la humedad y contenido de grasa y registra datos del espectro infrarrojo cercano (NIR) a 88 longitudes de onda. El científico selecciona aleatoriamente 54 de las 60 muestras y estima la relación entre las respuestas (humedad y grasa) y los predictores (las 88 longitudes de onda NIR) usando la regresión PLS. El científico utiliza las 6 muestras restantes como un conjunto de datos de prueba para evaluar la capacidad predictiva del modelo.

  1. Abra los datos de muestra, HarinaSoya.MTW.
  2. Elija Estadísticas > Regresión > Mínimos cuadrados parciales.
  3. En Respuestas, ingrese HumedadGrasa.
  4. En Modelo, ingrese '1'-'88'.
  5. Haga clic en Predicción.
  6. En Nueva observación para predictores continuos, ingrese Prueba1-Prueba88.
  7. En Nueva observación para respuestas (opcional), ingrese Humedad2Grasa2.
  8. Haga clic en Aceptar en cada cuadro de diálogo.

Interpretar los resultados

Los valores p para ambas respuestas son aproximadamente 0.000, que es menos que el nivel de significancia de 0.05. Estos resultados indican que al menos un coeficiente del modelo es diferente de cero. El valor del R2 de prueba para humedad es aproximadamente 0.9. El valor del R2 de prueba para grasa es casi 0.8. Los estadísticos R2 de prueba indican que los modelos predicen adecuadamente. El análisis de cada respuesta por separado daría resultados diferentes.

Método

Validación cruzadaNinguno
Componentes a calcularConjunto
Número de componentes calculados10

Análisis de varianza de Humedad

FuenteGLSCMCFP
Regresión10468.51646.851661.460.000
Error residual4332.7770.7623   
Total53501.293     

Análisis de varianza de Grasa

FuenteGLSCMCFP
Regresión10266.37826.637836.890.000
Error residual4331.0500.7221   
Total53297.428     

Selección y validación de modelo para Humedad

ComponentesVarianza
de X
ErrorR-cuadrado
10.98497696.92880.806643
20.99640088.99000.822479
30.99775771.93040.856510
40.99942758.31740.883666
50.99972258.12610.884048
60.99985348.52360.903203
70.99996345.98240.908272
80.99997633.15450.933862
90.99998232.80740.934554
100.99998632.77730.934615

Selección y validación de modelo para Grasa

ComponentesVarianza
de X
ErrorR-cuadrado
10.984976282.5190.050127
20.996400229.9640.226824
30.997757115.9510.610155
40.99942798.2850.669550
50.99972257.9940.805015
60.99985353.0970.821480
70.99996352.0100.825133
80.99997648.8420.835784
90.99998234.3440.884529
100.99998631.0500.895604

Respuesta pronosticada para las nuevas observaciones utilizando modelo para Humedad

FilaAjusteEE de ajusteIC de 95%IP de 95%
114.51840.388841(13.7343, 15.3026)(12.5910, 16.4459)
29.30490.372712(8.5532, 10.0565)(7.3904, 11.2193)
314.17900.504606(13.1614, 15.1966)(12.1454, 16.2127)
416.44770.559704(15.3189, 17.5764)(14.3562, 18.5391)
515.18720.358044(14.4652, 15.9093)(13.2842, 17.0903)
69.46390.485613(8.4846, 10.4433)(7.4492, 11.4787)
R-cuadrado de prueba: 0.906451

Respuesta pronosticada para las nuevas observaciones utilizando modelo para Grasa

FilaAjusteEE de ajusteIC de 95%IP de 95%
118.73720.378459(17.9740, 19.5004)(16.8612, 20.6132)
215.37820.362762(14.6466, 16.1098)(13.5149, 17.2415)
320.78380.491134(19.7933, 21.7743)(18.8044, 22.7632)
414.36840.544761(13.2698, 15.4670)(12.3328, 16.4040)
516.60160.348485(15.8988, 17.3044)(14.7494, 18.4538)
620.74710.472648(19.7939, 21.7003)(18.7861, 22.7080)
R-cuadrado de prueba: 0.762701