Bei der der binären logistischen Regression können Sie Daten in zwei verschiedenen Formaten eingeben: im binären Antwort-/Häufigkeitenformat und im Ereignis-/Versuchsformat. Die Zuverlässigkeit und Interpretation einiger Statistiken in der Ausgabe hängen vom Format der Daten ab. Weitere Informationen zur Verwendung der einzelnen Datenformate finden Sie unter In welchen Fällen werden die einzelnen Datenformate bei der binären logistischen Regression verwendet?.

Auswirkungen des Datenformats auf die Interpretation des R2 der Abweichung und des korrigierten R2 der Abweichung

Bei der binären logistischen Regression wirkt sich das Datenformat auf die Interpretation des R2 der Abweichung und des korrigierten R2 der Abweichung aus. Beim Ereignis-/Versuchsformat stellt jeder beobachtete Wert die Wahrscheinlichkeit des Ereignisses für alle Versuche in dieser Zeile der Daten dar. In der Regel gilt diese Wahrscheinlichkeit für viele Versuche und liegt zwischen 0 and 1. Beim binären Antwort-/Häufigkeitenformat dagegen stellt jede Beobachtung in der Regel nur 1 Versuch dar. Der beobachtete Wert für einen einzelnen Versuch beträgt entweder 1 oder 0.

Im Allgemeinen führt der Unterschied bei den Datenformaten zu unterschiedlichen Gesamtabweichungen in den Daten. Bei Daten im Ereignis-/Versuchsformat bezieht sich die Abweichung auf die Diskrepanz zwischen den prognostizierten Wahrscheinlichkeiten und den beobachteten Wahrscheinlichkeiten. Beim binären Antwort-/Häufigkeitenformat bezieht sich die Abweichung auf die Diskrepanz zwischen den prognostizierten Wahrscheinlichkeiten und dem Ergebnis von 0 % oder 100 % für jeden Versuch. Das R2 der Abweichung und das korrigierte R2 der Abweichung sind für Daten im Ereignis-/Versuchsformat in der Regel höher.

Ein grafische Darstellung verdeutlicht den Unterschied. In diesen Diagrammen stellen Symbole die Beobachtungen in den Daten dar, und die Kurve stellt die prognostizierten Werte im Modell dar. Bei Daten im Ereignis-/Versuchsformat liegen die Symbole nahe an der Linie. Der Wert des R2 der Abweichung für die Daten im Ereignis-/Versuchsformat beträgt ungefähr 96 %. Das Modell prognostiziert die durchschnittlichen Wahrscheinlichkeiten sehr gut.

Bei Daten im binären Antwort-/Häufigkeitenformat liegen die Beobachtungen nur dann nahe an der prognostizierten Linie, wenn die Linie nahe an 0 % oder 100 % verläuft. Der Wert des R2 der Abweichung für die Daten im binären Antwort-/Häufigkeitenformat beträgt ungefähr 56 %. Die Beziehung zwischen den prognostizierten Wahrscheinlichkeiten und den einzelnen Fällen ist weniger stark.

Warum kann der Abweichungstest auf Güte der Anpassung für Daten im binären Antwort-/Häufigkeitenformat irreführend sein?

Bei der binären logistischen Regression wirkt sich das Datenformat auf die Zuverlässigkeit des Abweichungstests auf Güte der Anpassung aus. Der p-Wert für den Abweichungstest auf Güte der Anpassung nimmt in der Regel mit abnehmender Anzahl von Versuchen pro Zeile ab. Daten im binären Antwort-/Häufigkeitenformat weisen in der Regel weniger Versuche pro Zeile auf. Daher weist der Abweichungstest auf Güte der Anpassung bei Daten im binären Antwort-/Häufigkeitenformat wahrscheinlich auf eine schlechte Anpassung hin, auch wenn die Anpassung gut ist. Der Abweichungstest auf Güte der Anpassung weist auch dann fälschlicherweise auf eine wahrscheinlich schlechte Anpassung hin, wenn die Daten im Ereignis-/Versuchsformat vorliegen, aber die Zahl der Versuche pro Zeile klein ist.

Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten nur wenige Versuche pro Zeile aufweisen, ist der Hosmer-Lemeshow-Test ein zuverlässigerer Indikator dafür, wie gut das Modell an die Daten angepasst ist.

Vergleichen Sie diese beiden Ergebnissätze für dieselben Daten in unterschiedlichen Formaten. Für diese Daten ist die Form des Modells korrekt. Die Informationen zur Antwortvariablen, die Koeffizienten und die Ergebnisse des Hosmer-Lemeshow-Tests stimmen überein. Die Schlussfolgerung für den Abweichungstest auf Güte der Anpassung hängt vom Datenformat ab.

In diesen Ergebnissen liegen die Daten im binären Antwort-/Häufigkeitenformat ohne Häufigkeitenspalte vor. Für die Analyse werden 500 Datenzeilen verwendet. Jede Zeile entspricht einem Versuch. Bei einem Signifikanzniveau von 0,05 zeigt der p-Wert für den Abweichungstest auf Güte der Anpassung an, dass das Modell schlecht angepasst ist. Dieser p-Wert führt zu der falschen Schlussfolgerung, dass das Modellformat nicht korrekt ist. Wenn Sie Daten im binären Antwort-/Häufigkeitenformat erfassen, ist der Abweichungstest auf Güte der Anpassung oft nicht zuverlässig.

Binary Logistic Regression: Y versus X

Method Link function Logit Rows used 500
Response Information Variable Value Count Y Event 160 (Event) Non-event 340 Total 500
Coefficients Term Coef SE Coef VIF Constant -2.107 0.282 X 0.0904 0.0121 11.97 X*X -0.000889 0.000115 11.97
Goodness-of-Fit Tests Test DF Chi-Square P-Value Deviance 497 552.03 0.044 Pearson 497 504.42 0.399 Hosmer-Lemeshow 3 3.76 0.288

In diesen Ergebnissen liegen die Daten im Ereignis-/Versuchsformat vor. Für die Analyse werden 5 Datenzeilen verwendet. Jede Zeile stellt 100 Versuche dar. Bei einem Signifikanzniveau von 0,05 weist der p-Wert für den Abweichungstest auf Güte der Anpassung nicht auf ein schlecht angepasstes Modell hin. Wenn Sie Daten im Ereignis-/Versuchsformat erfassen, ist der Abweichungstest auf Güte der Anpassung in der Regel zuverlässig.

Binary Logistic Regression: Event versus X

Method Link function Logit Rows used 5
Response Information Event Variable Value Count Name Event Event 160 Event Non-event 340 Trial Total 500
Coefficients Term Coef SE Coef VIF Constant -2.107 0.282 X 0.0904 0.0121 11.97 X*X -0.000889 0.000115 11.97
Goodness-of-Fit Tests Test DF Chi-Square P-Value Deviance 2 3.78 0.151 Pearson 2 3.76 0.152 Hosmer-Lemeshow 3 3.76 0.288

Warum kann der Pearson-Test auf Güte der Anpassung für Daten im binären Antwort-/Häufigkeitenformat irreführend sein?

Bei der binären logistischen Regression wirkt sich das Datenformat auf die Zuverlässigkeit des Pearson-Tests auf Güte der Anpassung aus. Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile klein ist. Daten im binären Antwort-/Häufigkeitenformat weisen in der Regel weniger Versuche pro Zeile auf. Daher ist der Pearson-Test auf Güte der Anpassung wahrscheinlich ungenau, wenn die Daten im binären Antwort-/Häufigkeitenformat vorliegen.

Der Hosmer-Lemeshow-Test hängt nicht vom Format der Daten ab. Wenn die Daten nur wenige Versuche pro Zeile aufweisen, ist der Hosmer-Lemeshow-Test ein zuverlässigerer Indikator dafür, wie gut das Modell an die Daten angepasst ist.

Vergleichen Sie diese beiden Ergebnissätze für dieselben Daten in unterschiedlichen Formaten. Für diese Daten ist die Form des Modells nicht korrekt. Das tatsächliche Modell enthält die Wechselwirkung zwischen x1 und x2. Die Informationen zur Antwortvariablen, die Koeffizienten und die Ergebnisse des Hosmer-Lemeshow-Tests stimmen überein. Die Schlussfolgerung aus dem Pearson-Test auf Güte der Anpassung hängt vom Datenformat ab.

In diesen Ergebnissen liegen die Daten im binären Antwort-/Häufigkeitenformat mit einer Häufigkeitenspalte vor. Für die Analyse werden 18 Datenzeilen verwendet. Jede Zeile stellt 250 Bernoulli-Versuche dar. Bei einem Signifikanzniveau von 0,05 zeigt der p-Wert für den Pearson-Test auf Güte der Anpassung an, dass das Modell an die Daten angepasst ist. Dieser p-Wert führt zu der falschen Schlussfolgerung, dass das Modell angemessen ist. Wenn Sie Daten im binären Antwort-/Häufigkeitenformat erfassen, ist der Pearson-Test auf Güte der Anpassung nicht zuverlässig.

Binary Logistic Regression: Y versus X1, X2

Method Link function Logit Frequency Frequency Rows used 18
Response Information Variable Value Count Y Yes 2645 (Event) No 1855 Total 4500
Coefficients Term Coef SE Coef VIF Constant -0.612 0.110 X1 0.1585 0.0375 1.00 X2 0.3290 0.0377 1.00
Goodness-of-Fit Tests Test DF Chi-Square P-Value Deviance 4497 6004.05 0.000 Pearson 4497 4504.84 0.464 Hosmer-Lemeshow 7 66.06 0.000

In diesen Ergebnissen liegen die Daten im Ereignis-/Versuchsformat vor. Für die Analyse werden 9 Datenzeilen verwendet. Jede Zeile stellt 500 Versuche dar. Bei einem Signifikanzniveau von 0,05 zeigt der p-Wert für den Test auf Güte der Anpassung nach Pearson an, dass das Modell nicht an die Daten angepasst ist. Wenn Sie Daten im Ereignis-/Versuchsformat erfassen, ist der Pearson-Test auf Güte der Anpassung in der Regel zuverlässig.

Binary Logistic Regression: Y versus X1, X2

Method Link function Logit Rows used 9
Response Information Event Variable Value Count Name Y Event 2645 Yes Non-event 1855 Trials Total 4500
Coefficients Term Coef SE Coef VIF Constant -0.612 0.110 X1 0.1585 0.0375 1.00 X2 0.3290 0.0377 1.00
Goodness-of-Fit Tests Test DF Chi-Square P-Value Deviance 6 67.48 0.000 Pearson 6 66.06 0.000 Hosmer-Lemeshow 7 66.06 0.000