Methoden und Formeln für die Anpassungen und Residuen in Faktoriellen Versuchsplan analysieren

Anpassung

Notation

BegriffBeschreibung
angepasster Wert
xkk-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein.
bkSchätzwert des k-ten Regressionskoeffizienten

Residuen

Das Residuum gibt die Differenz zwischen einem beobachteten Wert und dem entsprechenden angepassten Wert an. Dieser Teil der Beobachtung wird nicht durch das Modell erklärt. Das Residuum einer Beobachtung lautet:

Notation

BegriffBeschreibung
yii-ter beobachteter Wert der Antwortvariablen
i-ter angepasster Wert der Antwortvariablen

Standardisiertes Residuum (Std. Resid)

Standardisierte Residuen werden auch als intern studentisierte Residuen bezeichnet.

Formel

Notation

BegriffBeschreibung
ei i-tes Residuum
hi i-tes Diagonalelement von X(X'X)–1X'
s2 mittleres Fehlerquadrat
XDesignmatrix
X'transponierte Designmatrix

Entfernte (studentisierte) Residuen

Diese werden auch als extern studentisierte Residuen bezeichnet. Die Formel lautet wie folgt:

Die Formel kann auch wie folgt ausgedrückt werden:

In dem Modell, mit dem die i-te Beobachtung geschätzt wird, wird die i-te Beobachtung aus dem Datensatz entfernt. Daher kann die i-te Beobachtung den Schätzwert nicht beeinflussen. Jedes entfernte Residuum hat eine Student-t-Verteilung mit Freiheitsgraden.

Notation

BegriffBeschreibung
eii-tes Residuum
s(i)2mittlerer quadrierter Fehler, der ohne die i-te Beobachtung berechnet wurde
hi i-tes Diagonalelement von X(X'X)–1X'
nAnzahl der Beobachtungen
pAnzahl der Terme, einschließlich der Konstanten
SSESumme der Quadrate für Fehler

Residuen für Haupteinheiten

Der Teil der Beobachtung, der auf die Gesamtstreuung (nach Erklärung der Modellterme) in einem Split-Plot-Design zurückzuführen ist.

Notation

BegriffBeschreibung
angepasster Wert für das vollständige Modell (enthält den Fehlerterm für die Haupteinheiten sowie feste Terme)
angepasster Wert, für den nur die Terme für die festen Effekte und nicht der Fehlerterm für die Haupteinheiten verwendet werden

Standardfehler des angepassten Werts (SE Anpassung)

Der Standardfehler des angepassten Werts in einem Regressionsmodell mit einem Prädiktor wird wie folgt ausgedrückt:

Der Standardfehler des angepassten Werts in einem Regressionsmodell mit mehreren Prädiktoren wird wie folgt ausgedrückt:

Fügen Sie für die gewichtete Regression die Gewichtsmatrix in die Gleichung ein:

Wenn die Daten über einen Testdatensatz oder eine K-Falten-Kreuzvalidierung verfügen, sind die Formeln identisch. Der Wert von s2 stammt aus den Trainingsdaten. Die Designmatrix und die Gewichtsmatrix stammen ebenfalls aus den Trainingsdaten.

Notation

BegriffBeschreibung
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xii-ter predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X =0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Standardfehler der angepassten Werte (SE Anpassung) für ein Split-Plot-Design

Die Standardfehler der Koeffizienten sind die Quadratwurzeln der Diagonalelemente der Kovarianzmatrix:
Der Standardfehler des angepassten Werts an einem bestimmten Punkt (für Konfidenzintervalle verwendet) wird wie folgt ausgedrückt:
Der in den Prognoseintervallen verwendete Standardfehler wird wie folgt ausgedrückt:

Notation

BegriffBeschreibung
Varianzkomponente der Untereinheiten, berechnet als MSE(UE)
X(n × p)-Versuchsplanmatrix für Effekte von Faktoren, Kovariaten, Blöcken und den Fehlerterm der Haupteinheiten
Varianzkomponente der Haupteinheiten; für diese gilt in einem balancierten Versuchsplan die folgende Formel:
mAnzahl der Untereinheiten in einer Haupteinheit
z(n × w)-Matrix der Indikatoren für die Haupteinheiten (nur die Werte 1 und 0)
nAnzahl der Datenzeilen
pAnzahl der Koeffizienten
wAnzahl der Haupteinheiten
xZeilenvektor von Prädiktorstufen
Kovarianzmatrix von β
βVektor von Koeffizienten

Konfidenzintervall

Der Bereich, in dem der geschätzte Mittelwert der Antwortvariablen bei einer gegebenen Gruppe von Werten der Prädiktorvariablen erwartet wird.

Formel

Notation

BegriffBeschreibung
angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten
αWahrscheinlichkeit eines Fehlers 1. Art
nAnzahl der Beobachtungen
pAnzahl der Modellparameter
S 2(b)Varianz-Kovarianz-Matrix der Koeffizienten
s 2mittleres Fehlerquadrat
XVersuchsplanmatrix
X0Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen
X'0transponierter neuer Vektor von Prädiktorwerten mit 1 Zeile und p Spalten

Prognoseintervall

Das Prognoseintervall ist der Bereich, in dem der angepasste Wert der Antwortvariablen für eine neue Beobachtung erwartet wird.

Formel

Notation

BegriffBeschreibung
s(Prog)
angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten
αSignifikanzniveau
nAnzahl der Beobachtungen
pAnzahl der Modellparameter
s 2mittleres Fehlerquadrat
XPrädiktormatrix
X0Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen
X'0Transponierung des neuen Vektors von Prädiktorwerten mit 1 Zeilen und p Spalten