Methoden und Formeln für die Statistik der Anpassungsgüte in Binäres logistisches Modell anpassenund Binäre logistische Regression

Wählen Sie die gewünschte Methode oder Formel aus.

Abweichung

Die Abweichung ist ein Maß für die Unterschiede zwischen dem aktuellen Modell und dem vollständigen Modell. Bei dem vollständigen Modell handelt es sich um ein Modell mit n Parametern, einen Parameter pro Beobachtung. Das vollständige Modell maximiert die Log-Likelihood-Funktion. Es liefert einen Anhaltspunkt für Vergleiche von Modellen mit weniger als n Parametern. Bei Vergleichen mit dem vollständigen Modell wird die skalierte Abweichung verwendet.

Der Beitrag der einzelnen Datenpunkte zur skalierten Abweichung hängt vom Modell ab.

Modell Abweichung
Binomial
Poisson

Die Freiheitsgrade für den Test hängen vom Stichprobenumfang und von der Anzahl der Terme im Modell ab:

Notation

BegriffBeschreibung
Lf Log-Likelihood des vollständigen Modells
LcLog-Likelihood des Modells mit einer Teilmenge von Termen aus dem vollständigen Modell
yi Anzahl der Ereignisse für die i-te Zeile in den Daten
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile in den Daten
miAnzahl der Versuche für die i-te Zeile in den Daten
nAnzahl der Zeilen in den Daten
pFreiheitsgrade der Regression

Pearson

Mit der verallgemeinerten Chi-Quadrat-Statistik nach Pearson wird die relative Differenz zwischen den beobachteten und den angepassten Werten ausgewertet.

Die Freiheitsgrade für den Test hängen vom Stichprobenumfang und von der Anzahl der Terme im Modell ab. Die Pearson-Statistik weist für normalverteilte Daten exakt eine Chi-Quadrat-Verteilung auf. Bei nicht normalverteilten Daten, z. B. bei der Binomialverteilung und der Poisson-Verteilung, nähert sich die Statistik der Verteilung asymptotisch an.

Notation

BegriffBeschreibung
n Anzahl der Zeilen in den Daten
pFreiheitsgrade der Regression
yiWert der Antwortvariablen für das i-te Faktoren-/Kovariatenmuster
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile
V(·)Varianzfunktion für das Modell, wie weiter unten definiert

Die Varianzfunktion hängt vom Modell ab:

Modell Varianzfunktion
Binomial
Poisson

Hosmer-Lemeshow

Ein Test auf Güte der Anpassung für Modelle mit binären Antwortvariablen, der auf der Gruppierung von Daten nach geschätzten Wahrscheinlichkeiten basiert. Es handelt sich dabei um die Chi-Quadrat-Statistik aus einer (2 x g)-Tabelle der beobachteten und geschätzten erwarteten Häufigkeiten, wobei g die Anzahl der Gruppen ist. Die Freiheitsgrade für den Test entsprechen g – 2.

Die Formel lautet wie folgt:

Um die Gruppen zu bilden, ordnet Minitab die geschätzten Wahrscheinlichkeiten der Größe nach an und versucht dann, 10 gleich große Gruppen zu erstellen.

Die erwartete Anzahl der Ereignisse in einer Gruppe beträgt:

erwartete Ereignisse =

Der erwartete Wert für die Anzahl der Nicht-Ereignisse beträgt:

erwartete Nicht-Ereignisse =

Notation

BegriffBeschreibung
Anzahl der Versuche in der k-ten Gruppe
okAnzahl der Ereignisse in den Faktoren-/Kovariatenmustern
durchschnittliche geschätzte Wahrscheinlichkeit für jede Gruppe
πiangepasste Wahrscheinlichkeiten für die Faktoren-/Kovariatenmuster in einer Gruppe