Tests auf Güte der Anpassung für Binäres logistisches Modell anpassen

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Tabelle der Tests auf Güte der Anpassung.

Abweichungstest auf Güte der Anpassung

Beim Abweichungstest auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Viele Statistiken zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der p-Wert für den Abweichungstest ist für Daten mit einem Versuch pro Zeile tendenziell kleiner als für Daten mit mehreren Versuchen pro Zeile und nimmt generell mit der Anzahl der Versuche pro Zeile ab.

Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

Pearson-Test auf Güte der Anpassung

Beim Pearson-Test auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Viele Statistiken zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im Format mit einem Versuch pro Zeile vorliegen.

Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

Hosmer-Lemeshow

Beim Hosmer-Lemeshow-Test auf Güte der Anpassung werden die beobachteten und erwarteten Häufigkeiten von Ereignissen und Nicht-Ereignissen verglichen, um auszuwerten, wie gut das Modell an die Daten angepasst ist.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Der Hosmer-Lemeshow-Test hängt nicht von der Anzahl der Versuche pro Zeile in den Daten ab, wie dies bei anderen Tests auf Güte der Anpassung der Fall ist.Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar.

Beobachtete und erwartete Häufigkeiten für den Hosmer-Lemeshow-Test

Das Modell prognostiziert die erwarteten Häufigkeiten für den Hosmer-Lemeshow-Test.

Interpretation

Verwenden Sie die beobachteten und erwarteten Häufigkeiten für den Hosmer-Lemeshow-Test, um zu beschreiben, wie gut das Modell an die Daten angepasst ist, oder um nach schlecht angepassten Bereichen zu suchen.

Im Modell mit dem Term X weisen die Tests auf Güte der Anpassung beispielsweise kleine p-Werte auf, was darauf hinweist, dass das Modell schlecht an die Daten angepasst ist. In der Tabelle der beobachteten und erwarteten Häufigkeiten wichen die erwarteten Werte in allen Gruppen außer Gruppe 4 um mehr als 10 Ereignisse ab, wobei die Ereigniswahrscheinlichkeit zwischen 0,32 und 0,325 lag.

Wenn das Modell X und X*X enthält, weisen die Tests auf Güte der Anpassung große p-Werte auf. Die Daten liefern keine Anzeichen dafür, dass die geschätzten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird. Die größte Differenz zwischen der beobachteten und der erwarteten Anzahl von Ereignissen tritt in Gruppe 4 auf. Diese Differenz beträgt ungefähr 7.

Modell mit X

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante-0,8000,167-4,790,000 
x0,000920,002710,340,7351,00

Tests auf Güte der Anpassung

TestDFChi-Quadratp-Wert
Abweichung378,500,000
Pearson374,960,000
Hosmer-Lemeshow374,960,000

Beobachtete und erwartete Häufigkeiten für den Hosmer-Lemeshow-Test


Bereich der
Ereigniswahrscheinlichkeit
EreignisNicht-Ereignis
GruppeBeobachtetErwartetBeobachtetErwartet
1(0,000; 0,310)1031,09069,0
2(0,310; 0,315)4031,56068,5
3(0,315; 0,320)6032,04068,0
4(0,320; 0,325)3532,56567,5
5(0,325; 0,330)1533,08567,0

Modell mit X und X*X

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante-2,1070,282-7,460,000 
x0,09040,01217,460,00011,97
x*x-0,0008890,000115-7,750,00011,97

Tests auf Güte der Anpassung

TestDFChi-Quadratp-Wert
Abweichung23,780,151
Pearson23,760,152
Hosmer-Lemeshow33,760,288

Beobachtete und erwartete Häufigkeiten für den Hosmer-Lemeshow-Test


Bereich der
Ereigniswahrscheinlichkeit
EreignisNicht-Ereignis
GruppeBeobachtetErwartetBeobachtetErwartet
1(0,000; 0,108)1010,89089,2
2(0,108; 0,124)1512,48587,6
3(0,124; 0,401)4040,16059,9
4(0,401; 0,419)3541,96558,1
5(0,419; 0,548)6054,84045,2