Methoden und Formeln für die geschätzte Gleichung in Darstellung der binären Anpassungslinie

Wählen Sie die gewünschte Methode oder Formel aus.

Koeffizienten

Es gibt zwei Methoden, um die Maximum-Likelihood-Schätzwerte für die Koeffizienten zu ermitteln. Eine Methode besteht darin, die Likelihood-Funktion in Bezug auf die Koeffizienten direkt zu maximieren. Diese Ausdrücke sind in den Koeffizienten nichtlinear. Die alternative Methode besteht in einem iterativen Verfahren mit neu gewichteten kleinsten Quadraten; diese Methode verwendet Minitab, um die Schätzwerte der Koeffizienten zu erhalten. McCullagh und Nelder1 zeigen, dass die beiden Methoden äquivalent sind. Die iterative Methode mit neu gewichteten kleinsten Quadraten ist jedoch leichter zu implementieren. Weitere Informationen finden Sie in [1].

[1] P. McCullagh und J. A. Nelder (1989). Generalized Linear Models, 2nd Ed., Chapman & Hall/CRC, London.

Standardfehler der Koeffizienten

Der Standardfehler des i-ten Koeffizienten ist die positive Quadratwurzel des i-ten Diagonalelements der Varianz-Kovarianz-Matrix. Die Varianz-Kovarianz-Matrix hat die folgende Form:

W ist eine Diagonalmatrix, bei der die Diagonalelemente mit der folgenden Formel angegeben werden:

Dabei gilt Folgendes:

Diese Varianz-Kovarianz-Matrix beruht nicht auf der Fisher-Informationsmatrix, sondern auf der beobachteten Hesse-Matrix. Minitab verwendet die beobachtete Hesse-Matrix, da das resultierende Modell robuster gegenüber fehlerhaften Angaben der bedingten Mittelwerte ist.

Wenn die kanonische Linkfunktion verwendet wird, sind die beobachtete Hesse-Matrix und die Fisher-Informationsmatrix identisch.

Notation

BegriffBeschreibung
yiWert der Antwortvariablen für die i-te Zeile
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile
V(·)Varianzfunktion aus der folgenden Tabelle
g(·)Linkfunktion
V '(·)erste Ableitung der Varianzfunktion
g'(·)erste Ableitung der Linkfunktion
g''(·)zweite Ableitung der Linkfunktion

Die Varianzfunktion hängt vom Modell ab:

Modell Varianzfunktion
Binomial
Poisson

Weitere Informationen finden Sie unter [1] und [2].

[1] A. Agresti (1990). Categorical Data Analysis. John Wiley & Sons, Inc.

[2] P. McCullagh und J.A. Nelder (1992). Generalized Linear Model. Chapman & Hall.

Chancenverhältnisse für eine binäre logistische Regression

Das Chancenverhältnis wird nur ausgegeben, wenn Sie für ein Modell mit einer binären Antwortvariablen die Logit-Linkfunktion auswählen. In diesem Fall ist das Chancenverhältnis hilfreich beim Interpretieren der Beziehung zwischen einem Prädiktor und einer Antwortvariablen.

Der Wert für das Chancenverhältnis (τ) kann jede nicht negative Zahl sein. Das Chancenverhältnis  = 1 dient als Basis für den Vergleich. Wenn τ = 1, besteht zwischen der Antwortvariablen und dem Prädiktor keine Assoziation. Wenn τ < 1, ist die Chance für das Ereignis auf der Referenzstufe des Faktors (oder auf niedrigeren Stufen eines stetigen Prädiktors) größer. Wenn τ > 1, ist die Chance für das Ereignis auf der Referenzstufe des Faktors (oder auf niedrigeren Stufen eines stetigen Prädiktors) kleiner. Je weiter ein Wert von 1 entfernt ist, desto stärker ist der Grad der Assoziation.

Hinweis

Für das binäre logistische Regressionsmodell mit einer Kovariate oder einem Faktor beträgt die geschätzte Erfolgschance:

Die exponentielle Beziehung liefert eine Interpretation für β: Die Chance steigt bei jeder Zunahme von x um eine Einheit multiplikativ um eβ1. Das Chancenverhältnis entspricht exp(β1).

Wenn β z. B. 0,75 beträgt, beträgt das Chancenverhältnis exp(0,75), also 2,11. Dies weist darauf hin, dass die Erfolgschance mit jeder Zunahme von x um eine Einheit um 111 % ansteigt.

Notation

BegriffBeschreibung
geschätzte Wahrscheinlichkeit eines Erfolgs für die i-te Zeile in den Daten
geschätzter Koeffizient des Schnittpunkts mit der y-Achse
geschätzter Koeffizient für Prädiktor x
Datenpunkt für die i-te Zeile

Varianz-Kovarianz-Matrix

Hierbei handelt es sich um eine d x d-Matrix, wobei d die Anzahl der Prädiktoren plus eins ist. Die Varianz jedes Koeffizienten befindet sich in der Diagonalzelle, und die Kovarianz jedes Koeffizientenpaars befindet sich in der entsprechenden nicht diagonalen Zelle. Die Varianz ist der quadrierte Standardfehler des Koeffizienten.

Die Varianz-Kovarianz-Matrix stammt aus der letzten Iteration der Umkehrung der Informationsmatrix. Die Varianz-Kovarianz-Matrix hat die folgende Form:

W ist eine Diagonalmatrix, bei der die Diagonalelemente mit der folgenden Formel angegeben werden:

Dabei gilt Folgendes:

Diese Varianz-Kovarianz-Matrix beruht nicht auf der Fisher-Informationsmatrix, sondern auf der beobachteten Hesse-Matrix. Minitab verwendet die beobachtete Hesse-Matrix, da das resultierende Modell robuster gegenüber fehlerhaften Angaben der bedingten Mittelwerte ist.

Wenn die kanonische Linkfunktion verwendet wird, sind die beobachtete Hesse-Matrix und die Fisher-Informationsmatrix identisch.

Notation

BegriffBeschreibung
yi Wert der Antwortvariablen für die i-te Zeile
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile
V(·)Varianzfunktion aus der folgenden Tabelle
g(·)Linkfunktion
V '(·)erste Ableitung der Varianzfunktion
g'(·)erste Ableitung der Linkfunktion
g''(·)zweite Ableitung der Linkfunktion

Die Varianzfunktion hängt vom Modell ab:

Modell Varianzfunktion
Binomial
Poisson

Weitere Informationen finden Sie in [1] und [2].

[1] A. Agresti (1990). Categorical Data Analysis. John Wiley & Sons, Inc.

[2] P. McCullagh und J.A. Nelder (1992). Generalized Linear Model. Chapman & Hall.