Methoden und Formeln für Prognostizieren

Wählen Sie die gewünschte Methode oder Formel aus.

Konfidenzintervall

Der Bereich, in dem der geschätzte Mittelwert der Antwortvariablen bei einer gegebenen Gruppe von Werten der Prädiktorvariablen erwartet wird.

Formel

Notation

BegriffBeschreibung
angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten
αWahrscheinlichkeit eines Fehlers 1. Art
nAnzahl der Beobachtungen
pAnzahl der Modellparameter
S 2(b)Varianz-Kovarianz-Matrix der Koeffizienten
s 2mittleres Fehlerquadrat
XVersuchsplanmatrix
X0Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen
X'0transponierter neuer Vektor von Prädiktorwerten mit 1 Zeile und p Spalten

Anpassung

Notation

BegriffBeschreibung
angepasster Wert
xkk-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein.
bkSchätzwert des k-ten Regressionskoeffizienten

Standardfehler des angepassten Werts (SE Anpassung)

Der Standardfehler des angepassten Werts in einem Regressionsmodell mit einem Prädiktor wird wie folgt ausgedrückt:

Der Standardfehler des angepassten Werts in einem Regressionsmodell mit mehreren Prädiktoren wird wie folgt ausgedrückt:

Fügen Sie für die gewichtete Regression die Gewichtsmatrix in die Gleichung ein:

Wenn die Daten über einen Testdatensatz oder eine K-Falten-Kreuzvalidierung verfügen, sind die Formeln identisch. Der Wert von s2 stammt aus den Trainingsdaten. Die Designmatrix und die Gewichtsmatrix stammen ebenfalls aus den Trainingsdaten.

Notation

BegriffBeschreibung
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xii-ter predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X =0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Regressionsgleichung

Für ein Modell mit mehreren Prädiktoren lautet die Gleichung:

y= β0 + β1x1 + ... + βkxk + ε

Die angepasste Gleichung lautet:

Bei der einfachen linearen Regression, die nur einen Prädiktor enthält, lautet das Modell:

y=ß0+ ß1x1

Mit Regressionsabschätzungen b0 für ß0und b1 für ß1ergibt sich die angepasste Gleichung:

Gleichungen mit einer kategorialen Variablen

Wenn Sie eine kategoriale Variable in ein Regressionsmodell einbeziehen, gibt es zwei Möglichkeiten, die Regressionsgleichung darzustellen:
  • Separate Gleichung jeder Menge kategorischer Prädiktorstufen
  • Einzelne Gleichung
Diese beiden Optionen sind gleichwertig. Angenommen, die Daten haben folgende Variablen:
C1
Die Antwortvariable
C2
Ein stetiger Prädiktor
C3
Eine kategorische Prädiktorvariable mit den Stufen Rot und Blau
Die separaten Gleichungen sind wie folgt:
  • Blau: C1 = 0,184 + 0,1964*C2
  • Rot: C1 = 0,011 + 0,1964*C2

Eine einzelne Gleichung verwendet eine Indikatorvariable, um die kategoriale Variable darzustellen.

C1 = 0,184 + 0,1964*C2 + 0,0*C3_Blau- 0,173*C3_Rot

In der Einzelgleichung ist C3_Blau gleich 1, wenn die Beobachtung blau ist, und sonst 0. C3_Rot gleich 1, wenn die Beobachtungen rot sind, und sonst 0. Für jede Gruppe wird die Indikatorvariable eingesetzt, um zu überprüfen, dass die einzelne Gleichung mit den beiden separaten Gleichungen übereinstimmt.
  • Blaue Beobachtung (C3_Blau = 1, C3_Rot = 0): C1 = 0,184 + 0,1964*C2 + 0,0*1 - 0,173*0 = 0,184 + 0,1964*C2
  • Rote Beobachtung (C3_Blau = 0, C3_Rot = 1: C1 = 0,084 + 0,1964*C2 + 0,0*0 - 0,173*1 = 0,011 + 0,1964*C2

Notation

BegriffBeschreibung
yAntwortvariable
xkK-te Trimester. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein.
ßkk-te Populationsregressionskoeffizient
εFehlerterm, der einer Normalverteilung mit dem Mittelwert 0 folgt
bkSchätzung des k-ten Populationsregressionskoeffizienten
angepasste Antwortvariable

Prognoseintervall

Das Prognoseintervall ist der Bereich, in dem der angepasste Wert der Antwortvariablen für eine neue Beobachtung erwartet wird.

Formel

Notation

BegriffBeschreibung
s(Prog)
angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten
αSignifikanzniveau
nAnzahl der Beobachtungen
pAnzahl der Modellparameter
s 2mittleres Fehlerquadrat
XPrädiktormatrix
X0Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen
X'0Transponierung des neuen Vektors von Prädiktorwerten mit 1 Zeilen und p Spalten