Methoden und Formeln für die Anpassungen und Residuen in Faktoriellen Versuchsplan analysieren

In diesem Thema

Anpassung
Residuen
Standardisiertes Residuum (Std. Resid)
Entfernte (studentisierte) Residuen
Residuen für Haupteinheiten

Standardfehler des angepassten Werts (SE Anpassung)
Standardfehler der angepassten Werte (SE Anpassung) für ein Split-Plot-Design
Konfidenzintervall
Prognoseintervall

Anpassung

Notation

Begriff	Beschreibung
	angepasster Wert
x_k	k-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein.
b_k	Schätzwert des k-ten Regressionskoeffizienten

Residuen

Das Residuum gibt die Differenz zwischen einem beobachteten Wert und dem entsprechenden angepassten Wert an. Dieser Teil der Beobachtung wird nicht durch das Modell erklärt. Das Residuum einer Beobachtung lautet:

Notation

Begriff	Beschreibung
y_i	i-ter beobachteter Wert der Antwortvariablen
	i-ter angepasster Wert der Antwortvariablen

Standardisiertes Residuum (Std. Resid)

Standardisierte Residuen werden auch als intern studentisierte Residuen bezeichnet.

Formel

Notation

Begriff	Beschreibung
e_i	i-tes Residuum
h_i	i-tes Diagonalelement von X(X'X)^–1X'
s²	mittleres Fehlerquadrat
X	Designmatrix
X'	transponierte Designmatrix

Entfernte (studentisierte) Residuen

Diese werden auch als extern studentisierte Residuen bezeichnet. Die Formel lautet wie folgt:

Die Formel kann auch wie folgt ausgedrückt werden:

In dem Modell, mit dem die i-te Beobachtung geschätzt wird, wird die i-te Beobachtung aus dem Datensatz entfernt. Daher kann die i-te Beobachtung den Schätzwert nicht beeinflussen. Jedes entfernte Residuum hat eine Student-t-Verteilung mit Freiheitsgraden.

Notation

Begriff	Beschreibung
e_i	i-tes Residuum
s_(i)²	mittlerer quadrierter Fehler, der ohne die i-te Beobachtung berechnet wurde
h_i	i-tes Diagonalelement von X(X'X)^–1X'
n	Anzahl der Beobachtungen
p	Anzahl der Terme, einschließlich der Konstanten
SSE	Summe der Quadrate für Fehler

Residuen für Haupteinheiten

Der Teil der Beobachtung, der auf die Gesamtstreuung (nach Erklärung der Modellterme) in einem Split-Plot-Design zurückzuführen ist.

Notation

Begriff	Beschreibung
	angepasster Wert für das vollständige Modell (enthält den Fehlerterm für die Haupteinheiten sowie feste Terme)
	angepasster Wert, für den nur die Terme für die festen Effekte und nicht der Fehlerterm für die Haupteinheiten verwendet werden

Standardfehler des angepassten Werts (SE Anpassung)

Der Standardfehler des angepassten Werts in einem Regressionsmodell mit einem Prädiktor wird wie folgt ausgedrückt:

Der Standardfehler des angepassten Werts in einem Regressionsmodell mit mehreren Prädiktoren wird wie folgt ausgedrückt:

Fügen Sie für die gewichtete Regression die Gewichtsmatrix in die Gleichung ein:

Wenn die Daten über einen Testdatensatz oder eine K-Falten-Kreuzvalidierung verfügen, sind die Formeln identisch. Der Wert von s² stammt aus den Trainingsdaten. Die Designmatrix und die Gewichtsmatrix stammen ebenfalls aus den Trainingsdaten.

Notation

Begriff	Beschreibung
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^-ter predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X =₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

Standardfehler der angepassten Werte (SE Anpassung) für ein Split-Plot-Design

Die Standardfehler der Koeffizienten sind die Quadratwurzeln der Diagonalelemente der Kovarianzmatrix:

Der Standardfehler des angepassten Werts an einem bestimmten Punkt (für Konfidenzintervalle verwendet) wird wie folgt ausgedrückt:

Der in den Prognoseintervallen verwendete Standardfehler wird wie folgt ausgedrückt:

Notation

Begriff	Beschreibung
	Varianzkomponente der Untereinheiten, berechnet als MSE(UE)
X	(n × p)-Versuchsplanmatrix für Effekte von Faktoren, Kovariaten, Blöcken und den Fehlerterm der Haupteinheiten
	Varianzkomponente der Haupteinheiten; für diese gilt in einem balancierten Versuchsplan die folgende Formel:
m	Anzahl der Untereinheiten in einer Haupteinheit
z	(n × w)-Matrix der Indikatoren für die Haupteinheiten (nur die Werte 1 und 0)
n	Anzahl der Datenzeilen
p	Anzahl der Koeffizienten
w	Anzahl der Haupteinheiten
x	Zeilenvektor von Prädiktorstufen
	Kovarianzmatrix von β
β	Vektor von Koeffizienten

Konfidenzintervall

Der Bereich, in dem der geschätzte Mittelwert der Antwortvariablen bei einer gegebenen Gruppe von Werten der Prädiktorvariablen erwartet wird.

Formel

Notation

Begriff	Beschreibung

	angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten
α	Wahrscheinlichkeit eines Fehlers 1. Art
n	Anzahl der Beobachtungen
p	Anzahl der Modellparameter
S ²(b)	Varianz-Kovarianz-Matrix der Koeffizienten
s ²	mittleres Fehlerquadrat
X	Versuchsplanmatrix
X₀	Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen
X'₀	transponierter neuer Vektor von Prädiktorwerten mit 1 Zeile und p Spalten

Prognoseintervall

Das Prognoseintervall ist der Bereich, in dem der angepasste Wert der Antwortvariablen für eine neue Beobachtung erwartet wird.

Formel

Notation

Begriff	Beschreibung
s(Prog)
	angepasster Wert der Antwortvariablen für eine gegebene Gruppe von Prädiktorwerten
α	Signifikanzniveau
n	Anzahl der Beobachtungen
p	Anzahl der Modellparameter
s ²	mittleres Fehlerquadrat
X	Prädiktormatrix
X₀	Vektor der angegebenen Prädiktorwerte mit 1 Spalte und p Zeilen
X'₀	Transponierung des neuen Vektors von Prädiktorwerten mit 1 Zeilen und p Spalten