In Bezug auf Matrizen lauten die Formeln für die verschiedenen Summen der Quadrate wie folgt:
Minitab schlüsselt die Komponenten der Summe der Quadrate der Regression bzw. der Behandlungen in den Teil der Streuung auf, der durch die einzelnen Terme erklärt wird, wobei sowohl die sequenzielle Summe der Quadrate als auch die korrigierte Summe der Quadrate verwendet werden.
Begriff | Beschreibung |
---|---|
b | Vektor von Koeffizienten |
X | Designmatrix |
Y | Vektor von Werten der Antwortvariablen |
n | Anzahl der Beobachtungen |
J | (n x n)-Matrix von 1s |
Minitab schlüsselt die Varianzkomponenten der Summe der Quadrate der Regression bzw. der Behandlungen in sequenzielle Summen der Quadrate für die einzelnen Faktoren auf. Die sequenziellen Summen der Quadrate hängen von der Reihenfolge ab, in der die Faktoren bzw. Prädiktoren in das Modell aufgenommen wurden. Die sequenzielle Summe der Quadrate ist der eindeutige Anteil der Summe der Quadrate der Regression, der durch einen Faktor erklärt wird, nachdem alle zuvor aufgenommenen Faktoren erklärt wurden.
Wenn beispielsweise ein Modell mit den drei Faktoren bzw. Prädiktoren x1, x2 und x3 vorhanden ist, zeigt die sequenzielle Summe der Quadrate für x2, wie viel der verbleibenden Streuung durch x2 erklärt wird, nachdem x1 bereits in das Modell aufgenommen wurde. Wenn Sie eine andere Sequenz der Faktoren erhalten möchten, müssen Sie die Analyse wiederholen und dabei die Faktoren in einer anderen Reihenfolge aufnehmen.
Die Freiheitsgrade für jede Komponente des Modells werden wie folgt ausgedrückt:
Quellen der Streuung | DF |
---|---|
Regression | p |
Fehler | n – p – 1 |
Gesamt | n – 1 |
Begriff | Beschreibung |
---|---|
n | Anzahl der Beobachtungen |
p | Anzahl der Koeffizienten im Modell ohne die Konstante |
Die Formel für das Mittel der Quadrate (MS) der Regression lautet wie folgt:
Begriff | Beschreibung |
---|---|
Mittelwert der Antwortvariablen | |
i-ter angepasster Wert der Antwortvariablen | |
p | Anzahl der Terme im Modell |
Das mittlere Fehlerquadrat (das auch als MS Fehler oder MSE abgekürzt und als s2 angegeben wird) ist die Varianz um die angepasste Regressionslinie. Die Formel lautet wie folgt:
Begriff | Beschreibung |
---|---|
yi | i-ter beobachteter Wert der Antwortvariablen |
i-ter angepasster Wert der Antwortvariablen | |
n | Anzahl der Beobachtungen |
p | Anzahl der Koeffizienten im Modell, wobei die Konstante nicht gezählt wird |
Die Formel für den Gesamtmittelwert (MS) lautet:
Begriff | Beschreibung |
---|---|
Mittelwert der Antwortvariablen | |
yi | i-ter beobachteter Wert der Antwortvariablen |
n | Anzahl der Beobachtungen |
Die Formeln für die F-Statistiken lauten wie folgt:
Begriff | Beschreibung |
---|---|
MS Regression | Ein Maß der Streuung in der Antwortvariablen, die durch das aktuelle Modell erklärt wird. |
MS Fehler | Ein Maß der Streuung, die durch das Modell nicht erklärt wird. |
MS Term | Ein Maß der Streuung, die durch einen Term erklärt wird, nachdem die anderen Terme im Modell berücksichtigt wurden. |
MS Fehlende Anpassung | Ein Maß der Streuung in der Antwortvariablen, die durch Hinzufügen weiterer Terme zum Modell modelliert werden könnte. |
MS Reiner Fehler | Ein Maß der Streuung in replizierten Antwortdaten. |
Der p-Wert ist ein Wahrscheinlichkeitsmaß, das aus einer F-Verteilung mit den Freiheitsgraden (DF) wie folgt berechnet wird:
1 − P(F ≤ fj)
Begriff | Beschreibung |
---|---|
P(F ≤ f) | kumulative Verteilungsfunktion für die F-Verteilung |
f | F-Statistik für den Test |
wobei n gleich der Anzahl der Beobachtungen und m gleich der Anzahl der eindeutigen Kombinationen der x-Stufen ist
Große F-Werte und kleine p-Werte weisen darauf hin, dass das Modell ungeeignet ist.
1 − P(F ≤ fj)
Begriff | Beschreibung |
---|---|
P(F ≤ fj) | kumulative Verteilungsfunktion für die F-Verteilung |
fj | F-Statistik für den Test |