Methoden und Formeln für die Varianzanalyse in Definitiven Screening-Versuchsplan analysieren

In diesem Thema

Korrigierte Summe der Quadrate
Summe der Quadrate (SS)
Sequenzielle Summen der Quadrate
Freiheitsgrade (DF)
Kor MS – Modell
Kor MS – Term
Kor MS – Fehler
F
p-Wert – Tabelle der Varianzanalyse
p-Wert – Test auf fehlende Anpassung

Korrigierte Summe der Quadrate

Die korrigierte Summe der Quadrate hängt nicht von der Reihenfolge ab, in der die Terme in das Modell aufgenommen wurden. Die korrigierte Summe der Quadrate ist der Teil der Streuung, der durch einen Term erklärt wird, sofern alle anderen Terme im Modell enthalten sind, und zwar unabhängig von der Reihenfolge, in der die Terme in das Modell aufgenommen wurden.

Wenn beispielsweise ein Modell mit den drei Faktoren x1, x2 und x3 vorliegt, zeigt die korrigierte Summe der Quadrate für x2, wie viel der verbleibenden Streuung durch den Term für x2 erklärt wird, sofern die Terme für x1 und x3 bereits im Modell enthalten sind.

Die Berechnungen für die korrigierten Summen der Quadrate für drei Faktoren lauten wie folgt:

SSR(x3 | x1, x2) = SSE (x1, x2) – SSE (x1, x2, x3) oder
SSR(x3 | x1, x2) = SSR (x1, x2, x3) – SSR (x1, x2)

wobei SSR(x3 | x1, x2) die korrigierte Summe der Quadrate für x3 ist, sofern x1 und x2 im Modell enthalten sind.

SSR(x2, x3 | x1) = SSE (x1) – SSE (x1, x2, x3) oder
SSR(x2, x3 | x1) = SSR (x1, x2, x3) – SSR (x1)

wobei SSR(x2, x3 | x1) die korrigierte Summe der Quadrate für x2 und x3 ist, sofern x1 im Modell enthalten ist.

Sie können diese Formeln erweitern, wenn mehr als drei Faktoren im Modell vorhanden sind¹.

J. Neter, W. Wasserman und M. H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

Summe der Quadrate (SS)

In Bezug auf Matrizen lauten die Formeln für die verschiedenen Summen der Quadrate wie folgt:

Minitab schlüsselt die Komponente der Summe der Quadrate des Modells in den Teil der Streuung auf, der durch die einzelnen Terme bzw. Gruppen von Termen erklärt wird, wobei sowohl die sequenzielle Summe der Quadrate als auch die korrigierte Summe der Quadrate verwendet werden.

Notation

Begriff	Beschreibung
b	Vektor von Koeffizienten
X	Designmatrix
Y	Vektor von Werten der Antwortvariablen
n	Anzahl der Beobachtungen
J	(n x n)-Matrix von 1s

Sequenzielle Summen der Quadrate

Minitab schlüsselt die Varianzkomponente der Summe der Quadrate für das Modell in sequenzielle Summen der Quadrate für jeden Faktorterm bzw. jede Gruppe von Faktortermen auf. Die sequenziellen Summen der Quadrate hängen von der Reihenfolge ab, in der die Faktoren bzw. Prädiktoren in das Modell aufgenommen werden. Die sequenzielle Summe der Quadrate ist der eindeutige Anteil der Summe der Quadrate für das Modell, der über den Anteil aller zuvor aufgenommenen Terme hinaus von jedem Term erklärt wird.

Wenn beispielsweise ein Modell mit den drei Faktoren x1, x2 und x3 vorhanden ist, zeigt die sequenzielle Summe der Quadrate für x2, wie viel der verbleibenden Streuung durch x2 erklärt wird, sofern x1 bereits in das Modell aufgenommen wurde. Wenn Sie eine andere Sequenz der Terme erhalten möchten, wiederholen Sie die Analyse, und geben Sie dabei die Terme in einer anderen Reihenfolge ein.

Freiheitsgrade (DF)

Unterschiedliche Summen der Quadrate weisen unterschiedliche Freiheitsgrade auf.

DF für einen numerischen Faktor = 1

DF für einen kategorialen Faktor = b − 1

DF für einen quadratischen Term = 1

DF für Blöcke = c − 1

DF für Fehler = n − p

DF für reinen Fehler =

DF für fehlende Anpassung = m − p

DF Gesamt = n − 1

Für Wechselwirkungen zwischen Faktoren multiplizieren Sie die Freiheitsgrade für die Terme im Faktor. Bei den Faktoren A und B weist die Wechselwirkung AB beispielsweise diese Freiheitsgrade auf:

Um die Freiheitsgrade für einen Typ von Term zu ermitteln, summieren Sie die Freiheitsgrade für die Terme. Wenn beispielsweise die Faktoren A und B gegeben sind, weisen die Haupteffekte im Modell die folgende Anzahl von Freiheitsgraden auf:

Hinweis

Kategoriale Faktoren in Screening-Versuchsplänen von Minitab weisen zwei Stufen auf. Daher belaufen sich die Freiheitsgrade für einen kategorialen Faktor auf 2 – 1 = 1. Folglich weisen Wechselwirkungen zwischen Faktoren ebenfalls 1 Freiheitsgrad auf.

Notation

Begriff	Beschreibung
b	Anzahl der Stufen im Faktor
c	Anzahl der Blöcke
n	Gesamtzahl der Beobachtungen
n_i	Anzahl der Beobachtungen für die i-te Faktorstufenkombination
m	Anzahl der Faktorstufenkombinationen
p	Anzahl der Koeffizienten

Kor MS – Modell

Notation

Begriff	Beschreibung
	Mittelwert der Antwortvariablen
	i-ter angepasster Wert der Antwortvariablen
p	Anzahl der Terme im Modell, ausschließlich des konstanten Terms

Kor MS – Term

Die Berechnung für das Mittel der Quadrate (MS) für den Modellterm lautet wie folgt:

Kor MS – Fehler

Das mittlere Fehlerquadrat (das auch als MS Fehler oder MSE abgekürzt und als s² angegeben wird) ist die Varianz um die angepasste Regressionslinie. Die Formel lautet wie folgt:

Notation

Begriff	Beschreibung
y_i	i-ter beobachteter Wert der Antwortvariablen
	i-ter angepasster Wert der Antwortvariablen
n	Anzahl der Beobachtungen
p	Anzahl der Koeffizienten im Modell, wobei die Konstante nicht gezählt wird

F

Die Berechnung der F-Statistik hängt wie folgt vom Hypothesentest ab:

F(Term)
F(fehlende Anpassung)

Notation

Begriff	Beschreibung
Kor MS Term	Ein Maß der Streuung, die durch einen Term erklärt wird, nachdem die anderen Terme im Modell berücksichtigt wurden.
MS Fehler	Ein Maß der Streuung, die durch das Modell nicht erklärt wird.
MS Fehlende Anpassung	Ein Maß der Streuung in der Antwortvariablen, die durch Hinzufügen weiterer Terme zum Modell modelliert werden könnte.
MS Reiner Fehler	Ein Maß der Streuung in replizierten Antwortdaten.

J. Neter, W. Wasserman und M. H. Kutner (1985). Applied Linear Statistical Models, Second Edition. Irwin, Inc.

p-Wert – Tabelle der Varianzanalyse

Der p-Wert ist ein Wahrscheinlichkeitsmaß, das aus einer F-Verteilung mit den Freiheitsgraden (DF) wie folgt berechnet wird:

DF des Zählers: Summe der Freiheitsgrade für den Term oder die Terme im Test
DF des Nenners: Freiheitsgrade für Fehler

Formel

1 − P(F ≤ f_j)

Notation

Begriff	Beschreibung
P(F ≤ f)	kumulative Verteilungsfunktion für die F-Verteilung
f	F-Statistik für den Test

p-Wert – Test auf fehlende Anpassung

Dieser p-Wert gilt für den Test der Nullhypothese, dass die Koeffizienten für alle Terme, die aus diesen Daten geschätzt werden können und nicht im im Modell enthalten sind, gleich 0 sind. Der p-Wert gibt die Wahrscheinlichkeit aus einer F-Verteilung an, deren Freiheitsgrade (DF) wie folgt ausgedrückt werden:

DF des Zählers: Freiheitsgrade für fehlende Anpassung
DF des Nenners: Freiheitsgrade für reine Fehler

Formel

1 − P(F ≤ f_j)

Notation

Begriff	Beschreibung
P(F ≤ f_j)	kumulative Verteilungsfunktion für die F-Verteilung
f_j	F-Statistik für den Test