Ein Wissenschaftler in einem Labor für Lebensmittelchemie analysiert 60 Stichproben von Sojabohnenmehl. Für jede Stichprobe bestimmt der Wissenschaftler die Feuchtigkeit und den Fettgehalt, und er zeichnet Daten für 88 Wellenlängen aus dem NIR-Spektrum (nahe Infrarot) auf. Er wählt nach dem Zufallsprinzip 54 der 60 Stichproben aus und schätzt mit der PLS-Regression die Beziehung zwischen den Antwortvariablen (Feuchtigkeit und Fettgehalt) und den Prädiktoren (die 88 NIR-Wellenlängen). Der Wissenschaftler nutzt die verbleibenden sechs Stichproben als Testdatensatz, um die Prognosefähigkeit des Modells zu beurteilen.
Mit diesen Daten können Sie das Verfahren Regression der partiellen kleinsten Quadrate veranschaulichen.
Arbeitsblattspalte | Beschreibung | Variablentyp |
---|---|---|
C1-C88 | Daten aus dem NIR-Spektrum für 88 Wellenlängen von 54 Stichproben | Prädiktor |
Feuchtigkeit | Feuchtigkeit jeder Mehlstichprobe | Antwort |
Fett | Fettgehalt jeder Mehlstichprobe | Antwort |
C91-C178 | Daten aus dem NIR-Spektrum für 88 Wellenlängen von 6 Stichproben, die als Testdatensatz dienen | Prädiktor |
Feuchtigkeit2 | Feuchtigkeit jeder Mehlstichprobe des Testdatensatzes | Antwort |
Fett2 | Fettgehalt jeder Mehlstichprobe des Testdatensatzes | Antwort |