Methoden und Formeln für die Varianzanalyse in Regressionsmodell anpassen und Lineare Regression

Wählen Sie die gewünschte Methode oder Formel aus.

Summe der Quadrate (SS)

In Bezug auf Matrizen lauten die Formeln für die verschiedenen Summen der Quadrate wie folgt:

Minitab schlüsselt die Komponenten der Summe der Quadrate der Regression bzw. der Behandlungen in den Teil der Streuung auf, der durch die einzelnen Terme erklärt wird, wobei sowohl die sequenzielle Summe der Quadrate als auch die korrigierte Summe der Quadrate verwendet werden.

Notation

BegriffBeschreibung
bVektor von Koeffizienten
XDesignmatrix
YVektor von Werten der Antwortvariablen
nAnzahl der Beobachtungen
J(n x n)-Matrix von 1s

Sequenzielle Summe der Quadrate

Minitab schlüsselt die Varianzkomponenten der Summe der Quadrate der Regression bzw. der Behandlungen in sequenzielle Summen der Quadrate für die einzelnen Faktoren auf. Die sequenziellen Summen der Quadrate hängen von der Reihenfolge ab, in der die Faktoren bzw. Prädiktoren in das Modell aufgenommen wurden. Die sequenzielle Summe der Quadrate ist der eindeutige Anteil der Summe der Quadrate der Regression, der durch einen Faktor erklärt wird, nachdem alle zuvor aufgenommenen Faktoren erklärt wurden.

Wenn beispielsweise ein Modell mit den drei Faktoren bzw. Prädiktoren x1, x2 und x3 vorhanden ist, zeigt die sequenzielle Summe der Quadrate für x2, wie viel der verbleibenden Streuung durch x2 erklärt wird, nachdem x1 bereits in das Modell aufgenommen wurde. Wenn Sie eine andere Sequenz der Faktoren erhalten möchten, müssen Sie die Analyse wiederholen und dabei die Faktoren in einer anderen Reihenfolge aufnehmen.

Freiheitsgrade (DF)

Die Freiheitsgrade für jede Komponente des Modells werden wie folgt ausgedrückt:

Quellen der Streuung DF
Regression p
Fehler n – p – 1
Gesamt n – 1

Wenn die Daten bestimmte Kriterien erfüllen, und das Modell mindestens einen stetigen Prädiktor oder mehrere kategoriale Prädiktoren enthält, verwendet Minitab einige Freiheitsgrade für den Test auf fehlende Anpassung. Die Kriterien lauten wie folgt:
  • Die Daten enthalten mehrere Beobachtungen mit denselben Prädiktorwerten.
  • Die Daten enthalten die richtigen Punkte zum Schützen von zusätzlichen Termen, die sich nicht im Modell befinden.

Notation

BegriffBeschreibung
n Anzahl der Beobachtungen
p Anzahl der Koeffizienten im Modell ohne die Konstante

Kor MS – Regression

Die Formel für das Mittel der Quadrate (MS) der Regression lautet wie folgt:

Notation

BegriffBeschreibung
Mittelwert der Antwortvariablen
i-ter angepasster Wert der Antwortvariablen
pAnzahl der Terme im Modell

Kor MS – Fehler

Das mittlere Fehlerquadrat (das auch als MS Fehler oder MSE abgekürzt und als s2 angegeben wird) ist die Varianz um die angepasste Regressionslinie. Die Formel lautet wie folgt:

Notation

BegriffBeschreibung
yii-ter beobachteter Wert der Antwortvariablen
i-ter angepasster Wert der Antwortvariablen
nAnzahl der Beobachtungen
pAnzahl der Koeffizienten im Modell, wobei die Konstante nicht gezählt wird

Kor MS – Gesamt

Die Formel für den Gesamtmittelwert (MS) lautet:

Notation

BegriffBeschreibung
Mittelwert der Antwortvariablen
yii-ter beobachteter Wert der Antwortvariablen
nAnzahl der Beobachtungen

F-Wert

Die Formeln für die F-Statistiken lauten wie folgt:

F(Regression)
F(Term)
F(Fehlende Anpassung)

Notation

BegriffBeschreibung
MS RegressionEin Maß der Streuung in der Antwortvariablen, die durch das aktuelle Modell erklärt wird.
MS FehlerEin Maß der Streuung, die durch das Modell nicht erklärt wird.
MS TermEin Maß der Streuung, die durch einen Term erklärt wird, nachdem die anderen Terme im Modell berücksichtigt wurden.
MS Fehlende AnpassungEin Maß der Streuung in der Antwortvariablen, die durch Hinzufügen weiterer Terme zum Modell modelliert werden könnte.
MS Reiner FehlerEin Maß der Streuung in replizierten Antwortdaten.

p-Wert – Tabelle der Varianzanalyse

Der p-Wert ist ein Wahrscheinlichkeitsmaß, das aus einer F-Verteilung mit den Freiheitsgraden (DF) wie folgt berechnet wird:

DF des Zählers
Summe der Freiheitsgrade für den Term oder die Terme im Test
DF des Nenners
Freiheitsgrade für Fehler

Formel

1 − P(Ffj)

Notation

BegriffBeschreibung
P(Ff)kumulative Verteilungsfunktion für die F-Verteilung
fF-Statistik für den Test

Test auf fehlende Anpassung für reine Fehler

Zum Berechnen des Tests auf fehlende Anpassung für reine Fehler führt Minitab folgende Berechnungen aus:
  1. Die Summe der quadrierten Abweichungen der Antwortvariablen vom Mittelwert in jeder Gruppe von Replikationen; diese werden addiert, um die Summe der Quadrate für reine Fehler (SS PE) zu erhalten.
  2. Das Mittel der Quadrate für reine Fehler

    wobei n gleich der Anzahl der Beobachtungen und m gleich der Anzahl der eindeutigen Kombinationen der x-Stufen ist

  3. Die Summe der Quadrate für fehlende Anpassung
  4. Das Mittel der Quadrate für fehlende Anpassung
  5. Die Teststatistik

Große F-Werte und kleine p-Werte weisen darauf hin, dass das Modell ungeeignet ist.

p-Wert – Test auf fehlende Anpassung

Dieser p-Wert gilt für den Test der Nullhypothese, dass die Koeffizienten für alle Terme, die aus diesen Daten geschätzt werden können und nicht im im Modell enthalten sind, gleich 0 sind. Der p-Wert gibt die Wahrscheinlichkeit aus einer F-Verteilung an, deren Freiheitsgrade (DF) wie folgt ausgedrückt werden:
DF des Zählers
Freiheitsgrade für fehlende Anpassung
DF des Nenners
Freiheitsgrade für reine Fehler

Formel

1 − P(Ffj)

Notation

BegriffBeschreibung
P(Ffj)kumulative Verteilungsfunktion für die F-Verteilung
fjF-Statistik für den Test