Angepasste Werte sind auch bekannt als Anpassungen oder . Die angepassten Werte sind Punktschätzungen des Mittelwerts der Antwortvariablen für die gegebenen Werte der Prädiktoren. Die Werte der Prädiktoren werden auch als x-Werte bezeichnet.
Angepasste Werte werden durch Einsetzen der spezifischen x-Werte für jede Beobachtung im Datensatz in die Modellgleichung berechnet.
Wenn die Gleichung beispielsweise y = 5 + 10x lautet, ergibt ein x-Wert von 2 den angepassten Wert 25 (25 = 5 + 10(2)).
Der Standardfehler der Anpassung (SE Anpassung) ist ein Schätzwert der Streuung im geschätzten Mittelwert der Antwortvariablen für die angegebenen Variableneinstellungen. Der Standardfehler der Anpassung wird bei der Berechnung des Konfidenzintervalls für den Mittelwert der Antwortvariablen verwendet. Standardfehler sind immer nicht negativ.
Verwenden Sie den Standardfehler der Anpassung, um zu ermitteln, wie genau der Schätzwert für den Mittelwert der Antwortvariablen ist. Je kleiner der Standardfehler, desto genauer ist der prognostizierte Mittelwert der Antwortvariablen. Ein Analytiker entwickelt beispielsweise ein Modell, um die Lieferzeit zu prognostizieren. Für einen Satz von Variableneinstellungen prognostiziert das Modell eine mittlere Lieferzeit von 3,80 Tagen. Der Standardfehler der Anpassung für diese Einstellungen beträgt 0,08 Tage. Für einen zweiten Satz von Variableneinstellungen errechnet das Modell dieselbe mittlere Lieferzeit mit einem Standardfehler der Anpassung von 0,02 Tagen. Der Analytiker kann sich sicherer sein, dass die mittlere Lieferzeit für den zweiten Satz von Variableneinstellungen nahe an 3,80 Tagen liegt.
Der Standardfehler der Anpassung kann in Verbindung mit dem angepassten Wert verwendet werden, um ein Konfidenzintervall für den Mittelwert der Antwortvariablen zu erstellen. Angenommen, ein 95%-Konfidenzintervall erstreckt sich (je nach Freiheitsgraden) ungefähr +/- zwei Standardfehler um den prognostizierten Mittelwert. Für die Lieferzeiten beträgt das 95%-Konfidenzintervall des prognostizierten Mittelwerts von 3,80 Tagen bei einem Standardfehler von 0,08 (3,64; 3,96) Tage. Sie können sich zu 95 % sicher sein, dass der Mittelwert der Grundgesamtheit in diesem Bereich liegt. Wenn der Standardfehler 0,02 beträgt, ist das 95%-Konfidenzintervall (3,76; 3,84) Tage. Das Konfidenzintervall für den zweiten Satz von Variableneinstellungen ist schmaler, weil der Standardfehler kleiner ist.
Das Konfidenzintervall für die Anpassung gibt einen Bereich wahrscheinlicher Werte für den Mittelwert der Antwortvariablen bei bestimmten Einstellungen der Prädiktoren an.
Verwenden Sie das Konfidenzintervall, um den Schätzwert des angepassten Werts für die beobachteten Werte der Variablen auszuwerten.
Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Mittelwert der Grundgesamtheit für die angegebenen Werte der Variablen im Modell enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Ein breites Konfidenzintervall deutet darauf hin, dass Sie sich bezüglich des Mittelwerts von künftigen Werten weniger sicher sein können. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.
Das Prognoseintervall ist ein Bereich, der wahrscheinlich einen einzelnen zukünftigen Wert der Antwortvariablen für einen bestimmten Wert der Prädiktorvariablen enthält.
Beim 95%-Prognoseintervall können Sie sich zu 95 % sicher sein, dass neue Beobachtungen in dem Intervall liegen. (Beachten Sie jedoch, dass die nur für Werte gilt, die im Bereich der Daten in der Analyse enthalten sind.) Das Intervall wird durch eine untere und eine obere Grenze definiert, die aus dem Konfidenzniveau und dem Standardfehler der Prognose berechnet werden. Das Prognoseintervall ist immer breiter als das Konfidenzintervall. Dies ist auf die zusätzliche Ungewissheit beim Prognostizieren eines einzelnen Werts der Antwortvariablen gegenüber dem Mittelwert der Antwortvariablen zurückzuführen.
Das Test-R2 stellt den Anteil an der Streuung in den Antwortvariablen dar, der vom ursprünglichen Modell mit Hilfe von Prädiktorwerten aus den Testdaten erklärt werden kann.
Die Testdaten müssen dieselbe Anzahl von Prädiktoren wie der ursprüngliche Datensatz enthalten. Das Test-R2 kann nur berechnet werden, wenn die Testdaten Werte der Antwortvariablen für jede Beobachtung enthalten. Das Test-R2 wird auf dieselbe Weise wie das R2 berechnet.
Das Test-R2 gibt an, wie genau das PLS-Regressionsmodell die Testdaten prognostiziert. Höhere Werte des Test-R2 geben eine bessere Prognosefähigkeit des Modells an.
Die PLS-Regression wird oft in zwei Schritten durchgeführt. Im ersten Schritt, auch als Training bezeichnet, wird ein PLS-Regressionsmodell für einen Beispieldatensatz (auch als Trainingsdatensatz bezeichnet) berechnet. Im zweiten Schritt wird dieses Modell mit einem anderen Datensatz validiert, der auch als Testdatensatz bezeichnet wird. Manche, aber nicht alle Testdatensätze enthalten Werte für die Antwortvariable. Wenn der Testdatensatz Werte für die Antwortvariable enthält, kann Minitab einen Wert für das Test-R2 berechnen.
Wenn Sie die Kreuzvalidierung verwenden, vergleichen Sie das Test-R2 mit dem prognostizierten R2. Im Idealfall sollten diese Werte einander ähneln. Ein Test-R2, das signifikant kleiner als das prognostizierte R2 ist, weist darauf hin, dass die Kreuzvalidierung hinsichtlich der Prognosefähigkeit des Modells zu optimistisch ist oder die beiden Datenstichproben aus verschiedenen Grundgesamtheiten stammen.