Methoden und Formeln für das Modell in Regressionsmodell anpassen

Wählen Sie die gewünschte Methode oder Formel aus.

Gewichtete Regression

Bei der Regression der gewichteten kleinsten Quadrate handelt es sich um eine Methode zum Behandeln von Beobachtungen, deren Varianzen nicht konstant sind. Wenn die Varianzen nicht konstant sind, gelten für die Beobachtungen folgende Hinweise:

  • Großen Varianzen sollten relativ kleine Gewichtungen zugewiesen werden.
  • Kleinen Varianzen sollten relativ große Gewichtungen zugewiesen werden.

Üblicherweise wird für die Gewichtungen die Umkehrung der reinen Fehlervarianz in der Antwortvariablen ausgewählt.

Die Formel für die geschätzten Koeffizienten lautet wie folgt:
Dies entspricht dem Minimieren des gewichteten SS Fehler.

Notation

BegriffBeschreibung
XDesignmatrix
X'transponierte Designmatrix
Weine (n x n)-Matrix mit den Gewichtungen auf der Diagonalen
YVektor von Werten der Antwortvariablen
nAnzahl der Beobachtungen
wiGewichtung für die i-te Beobachtung
yiWert der Antwortvariablen für die i-te Beobachtung
angepasster Wert für die i-te Beobachtung

Box-Cox-Transformation

Bei der Box-Cox-Transformation werden Lambda-Werte (siehe unten) ausgewählt, die die Summe der Quadrate der Residuen minimieren. Die resultierende Transformation ist Y λ, wenn λ ≠ 0, und ln(Y), wenn λ = 0. Wenn λ < 0, multipliziert Minitab zudem die transformierte Antwortvariable mit −1, um die Reihenfolge aus der nicht transformierten Antwortvariablen beizubehalten.

Minitab sucht einen optimalen Wert zwischen −2 und 2. Werte, die außerhalb dieses Intervalls liegen, führen möglicherweise nicht zu einer besseren Anpassung.

Hier finden Sie einige der gängigsten Transformationen, wobei Y′ das transformierte Y der Daten darstellt:

Lambda-Wert (λ) Transformation
λ = 2 Y′ = Y 2
λ = 0,5 Y′ =
λ = 0 Y′ = ln(Y )
λ = −0,5
λ = −1 Y′ = −1 / Y

Regressionsgleichung

Für ein Modell mit mehreren Prädiktoren lautet die Gleichung:

y = β0 + β1x1 + … + βkxk + ε

Die angepasste Gleichung lautet:

Bei der einfachen linearen Regression, die nur einen Prädiktor enthält, lautet das Modell:

y=ß0+ ß1x1+ε

Bei Verwendung der Regressionsschätzwerte b0 für ß0 und b1 für ß1 lautet die angepasste Gleichung:

Notation

BegriffBeschreibung
yAntwortvariable
xkk-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein.
ßkk-ter Regressionskoeffizient der Grundgesamtheit
εFehlerterm, der einer Normalverteilung mit dem Mittelwert 0 folgt
bkSchätzwert des k-ten Regressionskoeffizienten der Grundgesamtheit
angepasste Antwortvariable

Designmatrix

Die Designmatrix enthält die Prädiktoren in einer Matrix (X) mit n Zeilen, wobei n die Anzahl der Beobachtungen ist. Für jeden Koeffizienten im Modell ist eine Spalte vorhanden.

Kategoriale Prädiktoren werden entweder mit der (1; 0)- oder der (-1; 0; 1)-Kodierung kodiert. X enthält keine Spalte für die Referenzstufe des Faktors.

Um die Spalten für einen Wechselwirkungsterm zu berechnen, multiplizieren Sie alle entsprechenden Werte für die Prädiktoren in der Wechselwirkung. Angenommen, die erste Beobachtung weist den Wert 4 für Prädiktor A und den Wert 2 für Prädiktor B auf. In der Designmatrix wird die Wechselwirkung zwischen A und B als 8 (4 x 2) dargestellt.

X'X invers

Eine p x p-Matrix, wobei p die Anzahl der Koeffizienten im Modell angibt. Durch Multiplikation von X'X invers mit MSE ergibt sich die Varianz-Kovarianz-Matrix der Koeffizienten. Minitab verwendet X'X invers auch, um die Regressionskoeffizienten und die „Dach-Matrix“ (Hat-Matrix) zu berechnen.
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien