Un científico que trabaja en un laboratorio de química de los alimentos analiza 60 muestras de harina de soya. Para cada muestra, el científico determina la humedad y contenido de grasa y registra datos del espectro infrarrojo cercano (NIR) a 88 longitudes de onda. El científico selecciona aleatoriamente 54 de las 60 muestras y estima la relación entre las respuestas (humedad y grasa) y los predictores (las 88 longitudes de onda NIR) usando la regresión PLS. El científico utiliza las 6 muestras restantes como un conjunto de datos de prueba para evaluar la capacidad predictiva del modelo.
Puede usar estos datos para hacer una demostración de Regresión de cuadrados mínimos parciales.
| Columna de la hoja de trabajo | Descripción | Tipo de variable |
|---|---|---|
| C1-C88 | Datos del espectro NIR para 88 longitudes de onda de las 54 muestras. | Predictor |
| Humedad | La humedad de cada muestra de harina. | Respuesta |
| Grasa | El contenido de grasa de cada muestra de harina. | Respuesta |
| C91-C178 | Datos del espectro NIR para 88 longitudes de onda de las 6 muestras utilizadas como conjunto de prueba. | Predictor |
| Humedad2 | La humedad de cada muestra de harina del conjunto prueba. | Respuesta |
| Grasa2 | El contenido de grasa de cada muestra de harina del conjunto prueba. | Respuesta |