Anpassungen und Residuen für Regression der partiellen kleinsten Quadrate

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Tabelle der Anpassungen und Residuen.

Anpassungen

Angepasste Werte sind auch bekannt als Anpassungen oder . Die angepassten Werte sind Punktschätzungen des Mittelwerts der Antwortvariablen für die gegebenen Werte der Prädiktoren. Die Werte der Prädiktoren werden auch als x-Werte bezeichnet.

Interpretation

Angepasste Werte werden durch Einsetzen der spezifischen x-Werte für jede Beobachtung im Datensatz in die Modellgleichung berechnet.

Wenn die Gleichung beispielsweise y = 5 + 10x lautet, ergibt ein x-Wert von 2 den angepassten Wert 25 (25 = 5 + 10(2)).

Residuum (Res)

Ein Residuum (ei) ist die Differenz zwischen einem beobachteten Wert (y) und dem entsprechenden angepassten Wert (), bei dem es sich um den Wert handelt, der vom Modell prognostiziert wird.

Dieses Streudiagramm zeigt das Gewicht im Vergleich zur Größe für eine Stichprobe erwachsener Männer. Die angepasste Regressionslinie stellt die Beziehung zwischen Größe und Gewicht dar. Wenn die Größe 6 Fuß beträgt, ist der angepasste Wert für das Gewicht 190 Pfund. Wenn das tatsächliche Gewicht 200 Pfund beträgt, ist das Residuum 10.

Interpretation

Stellen Sie die Residuen grafisch dar, um zu ermitteln, ob Ihr Modell angemessen ist und die Annahmen für die Regression erfüllt. Die Residuen können nützliche Informationen darüber liefern, wie gut das Modell an die Daten angepasst ist. Im Allgemeinen sollten die Residuen zufällig verteilt sein und weder offensichtliche Muster noch ungewöhnliche Werte aufweisen.

Standardisiertes Residuum (SRes)

Das standardisierte Residuum entspricht dem Wert eines Residuums ei dividiert durch einen Schätzwert von dessen Standardabweichung.

Interpretation

Verwenden Sie die standardisierten Residuen, wenn Sie Ausreißer erkennen möchten.

Standardisierten Residuen sind hilfreich, da Rohresiduen möglicherweise schlechte Anzeichen von Ausreißern sind. Die Varianz der einzelnen Rohresiduen kann um die entsprechenden x-Werte variieren. Aufgrund dieser ungleichen Skala ist es schwierig, die Größen der Rohresiduen einzuschätzen. Dieses Problem wird durch das Standardisieren der Residuen behoben, indem die verschiedenen Varianzen in eine einheitliche Skala umgewandelt werden.

Kreuzvalidierte angepasste Werte

In der PLS-Regression ist der kreuzvalidierte angepasste Wert der prognostizierte Wert der Antwortvariablen für jede Beobachtung im Datensatz. Die Berechnung erfolgt individuell für jede Beobachtung. Daher kann die Beobachtung aus dem Modell ausgeschlossen werden, das für die Berechnung des prognostizierten Werts der Antwortvariablen für diese Beobachtung verwendet wird. Die kreuzvalidierten angepassten Werte werden während der Kreuzvalidierung berechnet. Sie variieren je nach der Anzahl der entfernten Beobachtungen bei jeder Neuberechnung des Modells.

Verwenden Sie die kreuzvalidierten angepassten Werte, um zu ermitteln, wie präzise das Modell die Daten prognostiziert. Kreuzvalidierte angepasste Werte ähneln normalen angepassten Werten, die angeben, wie gut das Modell an die Daten angepasst ist.

Kreuzvalidierte Residuen

In der PLS-Regression sind die kreuzvalidierten Residuen die Differenzen zwischen den Ist-Werten der Antwortvariablen und den kreuzvalidierten angepassten Werten. Der kreuzvalidierte Residuenwert variiert je nach der Anzahl der entfernten Beobachtungen bei jeder Neuberechnung des Modells während der Kreuzvalidierung.

Die Residuen messen die Prognosefähigkeiten eines Modells. Minitab verwendet die kreuzvalidierten Residuen, um die PRESS-Statistik zu berechnen.