Tests auf Güte der Anpassung für Binäres logistisches Modell anpassen

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Tabelle der Tests auf Güte der Anpassung.

Abweichungstest auf Güte der Anpassung

Beim Abweichungstest auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Bei der binären logistischen Regression wirkt sich das Format der Daten auf den p-Wert aus, da je nach Format unterschiedliche Anzahlen von Versuchen pro Zeile vorliegen. Der p-Wert für den Abweichungstest nimmt in der Regel mit abnehmender Anzahl von Versuchen pro Zeile ab. Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

Pearson-Test auf Güte der Anpassung

Beim Pearson-Test auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Bei der binären logistischen Regression wirkt sich das Format der Daten auf den p-Wert aus, da je nach Format unterschiedliche Anzahlen von Versuchen pro Zeile vorliegen. Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im binären Antwort-/Häufigkeitenformat vorliegen. Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

Hosmer-Lemeshow

Beim Hosmer-Lemeshow-Test auf Güte der Anpassung werden die beobachteten und erwarteten Häufigkeiten von Ereignissen und Nicht-Ereignissen verglichen, um auszuwerten, wie gut das Modell an die Daten angepasst ist.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Der Hosmer-Lemeshow-Test hängt nicht von der Anzahl der Versuche pro Zeile in den Daten ab, wie dies bei anderen Tests auf Güte der Anpassung der Fall ist. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar.

Beobachtete und erwartete Häufigkeiten für den Hosmer-Lemeshow-Test

Das Modell prognostiziert die erwarteten Häufigkeiten für den Hosmer-Lemeshow-Test.

Interpretation

Verwenden Sie die beobachteten und erwarteten Häufigkeiten für den Hosmer-Lemeshow-Test, um zu beschreiben, wie gut das Modell an die Daten angepasst ist, oder um nach schlecht angepassten Bereichen zu suchen.

Im Modell mit dem Term X weisen die Tests auf Güte der Anpassung beispielsweise kleine p-Werte auf, was darauf hinweist, dass das Modell schlecht an die Daten angepasst ist. In der Tabelle der beobachteten und erwarteten Häufigkeiten wichen die erwarteten Werte in allen Gruppen außer Gruppe 4 um mehr als 10 Ereignisse ab, wobei die Ereigniswahrscheinlichkeit zwischen 0,32 und 0,325 lag.

Wenn das Modell X und X*X enthält, weisen die Tests auf Güte der Anpassung große p-Werte auf. Die Daten liefern keine Anzeichen dafür, dass die geschätzten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird. Die größte Differenz zwischen der beobachteten und der erwarteten Anzahl von Ereignissen tritt in Gruppe 4 auf. Diese Differenz beträgt ungefähr 7.

Binäre Logistische Regression: Ereignis vs. x

Koeffizienten Term Koef SE Koef VIF Konstante -0,800 0,167 x 0,00092 0,00271 1,00
Tests auf Güte der Anpassung Test DF Chi-Quadrat p-Wert Abweichung 3 78,50 0,000 Pearson 3 74,96 0,000 Hosmer-Lemeshow 3 74,96 0,000
Beobachtete und erwartete Häufigkeiten für den Hosmer-Lemeshow-Test Bereich der Ereignis Nicht-Ereignis Gruppe Ereigniswahrscheinlichkeit Beobachtet Erwartet Beobachtet Erwartet 1 (0,000; 0,310) 10 31,0 90 69,0 2 (0,310; 0,315) 40 31,5 60 68,5 3 (0,315; 0,320) 60 32,0 40 68,0 4 (0,320; 0,325) 35 32,5 65 67,5 5 (0,325; 0,330) 15 33,0 85 67,0

Binäre Logistische Regression: Ereignis vs. x

Informationen zur Antwortvariablen Variable Wert Anzahl Ereignisbezeichnung Ereignis Ereignis 160 Ereignis Nicht-Ereignis 340 Versuch Gesamt 500
Koeffizienten Term Koef SE Koef VIF Konstante -2,107 0,282 x 0,0904 0,0121 11,97 x*x -0,000889 0,000115 11,97
Tests auf Güte der Anpassung Test DF Chi-Quadrat p-Wert Abweichung 2 3,78 0,151 Pearson 2 3,76 0,152 Hosmer-Lemeshow 3 3,76 0,288
Beobachtete und erwartete Häufigkeiten für den Hosmer-Lemeshow-Test Bereich der Ereignis Nicht-Ereignis Gruppe Ereigniswahrscheinlichkeit Beobachtet Erwartet Beobachtet Erwartet 1 (0,000; 0,108) 10 10,8 90 89,2 2 (0,108; 0,124) 15 12,4 85 87,6 3 (0,124; 0,401) 40 40,1 60 59,9 4 (0,401; 0,419) 35 41,9 65 58,1 5 (0,419; 0,548) 60 54,8 40 45,2
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien