Methoden und Formeln für die Statistik der Anpassungsgüte in Binäres logistisches Modell anpassenund Binäre logistische Regression

Wählen Sie die gewünschte Methode oder Formel aus.

In diesem Thema

Abweichung
Pearson
Hosmer-Lemeshow

Abweichung

Die Abweichung ist ein Maß für die Unterschiede zwischen dem aktuellen Modell und dem vollständigen Modell. Bei dem vollständigen Modell handelt es sich um ein Modell mit n Parametern, einen Parameter pro Beobachtung. Das vollständige Modell maximiert die Log-Likelihood-Funktion. Es liefert einen Anhaltspunkt für Vergleiche von Modellen mit weniger als n Parametern. Bei Vergleichen mit dem vollständigen Modell wird die skalierte Abweichung verwendet.

Der Beitrag der einzelnen Datenpunkte zur skalierten Abweichung hängt vom Modell ab.

Modell	Abweichung
Binomial
Poisson

Die Freiheitsgrade für den Test hängen vom Stichprobenumfang und von der Anzahl der Terme im Modell ab:

Notation

Begriff	Beschreibung
L_f	Log-Likelihood des vollständigen Modells
L_c	Log-Likelihood des Modells mit einer Teilmenge von Termen aus dem vollständigen Modell
y_i	Anzahl der Ereignisse für die i-te Zeile in den Daten
	geschätzter Mittelwert der Antwortvariablen für die i-te Zeile in den Daten
m_i	Anzahl der Versuche für die i-te Zeile in den Daten
n	Anzahl der Zeilen in den Daten
p	Freiheitsgrade der Regression

Pearson

Mit der verallgemeinerten Chi-Quadrat-Statistik nach Pearson wird die relative Differenz zwischen den beobachteten und den angepassten Werten ausgewertet.

Die Freiheitsgrade für den Test hängen vom Stichprobenumfang und von der Anzahl der Terme im Modell ab. Die Pearson-Statistik weist für normalverteilte Daten exakt eine Chi-Quadrat-Verteilung auf. Bei nicht normalverteilten Daten, z. B. bei der Binomialverteilung und der Poisson-Verteilung, nähert sich die Statistik der Verteilung asymptotisch an.

Notation

Begriff	Beschreibung
n	Anzahl der Zeilen in den Daten
p	Freiheitsgrade der Regression
y_i	Wert der Antwortvariablen für das i-te Faktoren-/Kovariatenmuster
	geschätzter Mittelwert der Antwortvariablen für die i-te Zeile
V(·)	Varianzfunktion für das Modell, wie weiter unten definiert

Die Varianzfunktion hängt vom Modell ab:

Modell	Varianzfunktion
Binomial
Poisson

Hosmer-Lemeshow

Ein Test auf Güte der Anpassung für Modelle mit binären Antwortvariablen, der auf der Gruppierung von Daten nach geschätzten Wahrscheinlichkeiten basiert. Es handelt sich dabei um die Chi-Quadrat-Statistik aus einer (2 x g)-Tabelle der beobachteten und geschätzten erwarteten Häufigkeiten, wobei g die Anzahl der Gruppen ist. Die Freiheitsgrade für den Test entsprechen g – 2.

Die Formel lautet wie folgt:

Um die Gruppen zu bilden, ordnet Minitab die geschätzten Wahrscheinlichkeiten der Größe nach an und versucht dann, 10 gleich große Gruppen zu erstellen.

Die erwartete Anzahl der Ereignisse in einer Gruppe beträgt:

erwartete Ereignisse =

Der erwartete Wert für die Anzahl der Nicht-Ereignisse beträgt:

erwartete Nicht-Ereignisse =

Notation

Begriff	Beschreibung
	Anzahl der Versuche in der k-ten Gruppe
o_k	Anzahl der Ereignisse in den Faktoren-/Kovariatenmustern
	durchschnittliche geschätzte Wahrscheinlichkeit für jede Gruppe
π_i	angepasste Wahrscheinlichkeiten für die Faktoren-/Kovariatenmuster in einer Gruppe