Prognostizierte Antwort für neue Beobachtungen für Regression der partiellen kleinsten Quadrate

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Tabelle der prognostizierten Antwort.

In diesem Thema

Anpassungen
SE Anpassung
95%-KI
95%-PI
Test-R-Qd

Anpassungen

Angepasste Werte sind auch bekannt als Anpassungen oder . Die angepassten Werte sind Punktschätzungen des Mittelwerts der Antwortvariablen für die gegebenen Werte der Prädiktoren. Die Werte der Prädiktoren werden auch als x-Werte bezeichnet.

Interpretation

Angepasste Werte werden durch Einsetzen der spezifischen x-Werte für jede Beobachtung im Datensatz in die Modellgleichung berechnet.

Wenn die Gleichung beispielsweise y = 5 + 10x lautet, ergibt ein x-Wert von 2 den angepassten Wert 25 (25 = 5 + 10(2)).

SE Anpassung

Der Standardfehler der Anpassung (SE Anpassung) ist ein Schätzwert der Streuung im geschätzten Mittelwert der Antwort für die angegebenen Variableneinstellungen. Der Standardfehler der Anpassung wird bei der Berechnung des Konfidenzintervalls für den Mittelwert der Antwortvariablen verwendet. Standardfehler sind immer nicht negativ. Die Analyse berechnet Standardfehler für Modelle aus dem Statistik Menü und Modelle aus Lineare Regression und Binäre logistische Regression aus der Predictive Analytics-Modul.

Interpretation

Verwenden Sie den Standardfehler der Anpassung, um zu ermitteln, wie genau der Schätzwert für den Mittelwert der Antwort ist. Je kleiner der Standardfehler, desto genauer ist der prognostizierte Mittelwert der Antwort. Ein Analytiker entwickelt beispielsweise ein Modell, um die Lieferzeit zu prognostizieren. Für einen Satz von Variableneinstellungen prognostiziert das Modell eine mittlere Lieferzeit von 3,80 Tagen. Der Standardfehler der Anpassung für diese Einstellungen beträgt 0,08 Tage. Für einen zweiten Satz von Variableneinstellungen errechnet das Modell dieselbe mittlere Lieferzeit mit einem Standardfehler der Anpassung von 0,02 Tagen. Der Analytiker kann sich sicherer sein, dass die mittlere Lieferzeit für den zweiten Satz von Variableneinstellungen nahe an 3,80 Tagen liegt.

Mit dem angepassten Wert können Sie den Standardfehler der Anpassung verwenden, um ein Konfidenzintervall für die mittlere Antwortvariablen zu erstellen. Abhängig von der Anzahl der Freiheitsgrade erstreckt sich ein Konfidenzintervall von 95 % beispielsweise über und unter den vorhergesagten Mittelwert. Für die Lieferzeiten beträgt das 95%-Konfidenzintervall des prognostizierten Mittelwerts von 3,80 Tagen bei einem Standardfehler von 0,08 (3,64; 3,96) Tage. Sie können zu 95 % sicher sein, dass der Mittelwert der Grundgesamtheit innerhalb dieses Bereichs liegt. Wenn der Standardfehler 0,02 beträgt, ist das 95%-Konfidenzintervall (3,76; 3,84) Tage. Das Konfidenzintervall für den zweiten Satz von Variableneinstellungen ist schmaler, weil der Standardfehler kleiner ist.

95%-KI

Das Konfidenzintervall für die Anpassung gibt einen Bereich wahrscheinlicher Werte für den Mittelwert der Antwortvariablen bei bestimmten Einstellungen der Prädiktoren an.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des angepassten Werts für die beobachteten Werte der Variablen auszuwerten.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Mittelwert der Grundgesamtheit für die angegebenen Werte der Variablen im Modell enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Ein breites Konfidenzintervall deutet darauf hin, dass Sie sich bezüglich des Mittelwerts von künftigen Werten weniger sicher sein können. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

95%-PI

Das Prognoseintervall ist ein Bereich, der wahrscheinlich einen einzelnen zukünftigen Wert der Antwortvariablen für einen bestimmten Wert der Prädiktorvariablen enthält.

Interpretation

Beim 95%-Prognoseintervall können Sie sich zu 95 % sicher sein, dass neue Beobachtungen in dem Intervall liegen. (Beachten Sie jedoch, dass die nur für Werte gilt, die im Bereich der Daten in der Analyse enthalten sind.) Das Intervall wird durch eine untere und eine obere Grenze definiert, die aus dem Konfidenzniveau und dem Standardfehler der Prognose berechnet werden. Das Prognoseintervall ist immer breiter als das Konfidenzintervall. Dies ist auf die zusätzliche Ungewissheit beim Prognostizieren eines einzelnen Werts der Antwortvariablen gegenüber dem Mittelwert der Antwortvariablen zurückzuführen.

Test-R-Qd

Das Test-R² stellt den Anteil an der Streuung in den Antwortvariablen dar, der vom ursprünglichen Modell mit Hilfe von Prädiktorwerten aus den Testdaten erklärt werden kann.

Die Testdaten müssen dieselbe Anzahl von Prädiktoren wie der ursprüngliche Datensatz enthalten. Das Test-R² kann nur berechnet werden, wenn die Testdaten Werte der Antwortvariablen für jede Beobachtung enthalten. Das Test-R² wird auf dieselbe Weise wie das R² berechnet.

Interpretation

Das Test-R² gibt an, wie genau das PLS-Regressionsmodell die Testdaten prognostiziert. Höhere Werte des Test-R² geben eine bessere Prognosefähigkeit des Modells an.

Die PLS-Regression wird oft in zwei Schritten durchgeführt. Im ersten Schritt, auch als Training bezeichnet, wird ein PLS-Regressionsmodell für einen Beispieldatensatz (auch als Trainingsdatensatz bezeichnet) berechnet. Im zweiten Schritt wird dieses Modell mit einem anderen Datensatz validiert, der auch als Testdatensatz bezeichnet wird. Manche, aber nicht alle Testdatensätze enthalten Werte für die Antwortvariable. Wenn der Testdatensatz Werte für die Antwortvariable enthält, kann Minitab einen Wert für das Test-R² berechnen.

Wenn Sie die Kreuzvalidierung verwenden, vergleichen Sie das Test-R² mit dem prognostizierten R². Im Idealfall sollten diese Werte einander ähneln. Ein Test-R², das signifikant kleiner als das prognostizierte R² ist, weist darauf hin, dass die Kreuzvalidierung hinsichtlich der Prognosefähigkeit des Modells zu optimistisch ist oder die beiden Datenstichproben aus verschiedenen Grundgesamtheiten stammen.