Beim Abweichungstest auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.
Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.
Viele Statistiken zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der p-Wert für den Abweichungstest ist für Daten mit einem Versuch pro Zeile tendenziell kleiner als für Daten mit mehreren Versuchen pro Zeile und nimmt generell mit der Anzahl der Versuche pro Zeile ab.
Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.
Beim Pearson-Test auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.
Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.
Viele Statistiken zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im Format mit einem Versuch pro Zeile vorliegen.
Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.
Beim Hosmer-Lemeshow-Test auf Güte der Anpassung werden die beobachteten und erwarteten Häufigkeiten von Ereignissen und Nicht-Ereignissen verglichen, um auszuwerten, wie gut das Modell an die Daten angepasst ist.
Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.
Der Hosmer-Lemeshow-Test hängt nicht von der Anzahl der Versuche pro Zeile in den Daten ab, wie dies bei anderen Tests auf Güte der Anpassung der Fall ist.Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar.
Das Modell prognostiziert die erwarteten Häufigkeiten für den Hosmer-Lemeshow-Test.
Verwenden Sie die beobachteten und erwarteten Häufigkeiten für den Hosmer-Lemeshow-Test, um zu beschreiben, wie gut das Modell an die Daten angepasst ist, oder um nach schlecht angepassten Bereichen zu suchen.
Im Modell mit dem Term X weisen die Tests auf Güte der Anpassung beispielsweise kleine p-Werte auf, was darauf hinweist, dass das Modell schlecht an die Daten angepasst ist. In der Tabelle der beobachteten und erwarteten Häufigkeiten wichen die erwarteten Werte in allen Gruppen außer Gruppe 4 um mehr als 10 Ereignisse ab, wobei die Ereigniswahrscheinlichkeit zwischen 0,32 und 0,325 lag.
Wenn das Modell X und X*X enthält, weisen die Tests auf Güte der Anpassung große p-Werte auf. Die Daten liefern keine Anzeichen dafür, dass die geschätzten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird. Die größte Differenz zwischen der beobachteten und der erwarteten Anzahl von Ereignissen tritt in Gruppe 4 auf. Diese Differenz beträgt ungefähr 7.
Term | Koef | SE Koef | z-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | -0,800 | 0,167 | -4,79 | 0,000 | |
x | 0,00092 | 0,00271 | 0,34 | 0,735 | 1,00 |
Test | DF | Chi-Quadrat | p-Wert |
---|---|---|---|
Abweichung | 3 | 78,50 | 0,000 |
Pearson | 3 | 74,96 | 0,000 |
Hosmer-Lemeshow | 3 | 74,96 | 0,000 |
Bereich der Ereigniswahrscheinlichkeit | Ereignis | Nicht-Ereignis | |||
---|---|---|---|---|---|
Gruppe | Beobachtet | Erwartet | Beobachtet | Erwartet | |
1 | (0,000; 0,310) | 10 | 31,0 | 90 | 69,0 |
2 | (0,310; 0,315) | 40 | 31,5 | 60 | 68,5 |
3 | (0,315; 0,320) | 60 | 32,0 | 40 | 68,0 |
4 | (0,320; 0,325) | 35 | 32,5 | 65 | 67,5 |
5 | (0,325; 0,330) | 15 | 33,0 | 85 | 67,0 |
Term | Koef | SE Koef | z-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | -2,107 | 0,282 | -7,46 | 0,000 | |
x | 0,0904 | 0,0121 | 7,46 | 0,000 | 11,97 |
x*x | -0,000889 | 0,000115 | -7,75 | 0,000 | 11,97 |
Test | DF | Chi-Quadrat | p-Wert |
---|---|---|---|
Abweichung | 2 | 3,78 | 0,151 |
Pearson | 2 | 3,76 | 0,152 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Bereich der Ereigniswahrscheinlichkeit | Ereignis | Nicht-Ereignis | |||
---|---|---|---|---|---|
Gruppe | Beobachtet | Erwartet | Beobachtet | Erwartet | |
1 | (0,000; 0,108) | 10 | 10,8 | 90 | 89,2 |
2 | (0,108; 0,124) | 15 | 12,4 | 85 | 87,6 |
3 | (0,124; 0,401) | 40 | 40,1 | 60 | 59,9 |
4 | (0,401; 0,419) | 35 | 41,9 | 65 | 58,1 |
5 | (0,419; 0,548) | 60 | 54,8 | 40 | 45,2 |