Interpretieren der wichtigsten Ergebnisse für Binäres logistisches Modell anpassen

Führen Sie die folgenden Schritte aus, um ein binäres logistisches Modell zu interpretieren. Zu den wichtigsten Ausgaben zählen der p-Wert, die Koeffizienten, das R2 und die Tests auf Güte der Anpassung.

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, dass Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein stetiger Prädiktor signifikant ist, können Sie schlussfolgern, dass sich der Koeffizient für den Prädiktor von null unterscheidet.
  • Wenn ein kategorialer Prädiktor signifikant ist, können Sie schlussfolgern, dass nicht alle Stufen des Faktors die gleiche Wahrscheinlichkeit aufweisen.
  • Wenn ein Wechselwirkungsterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Wahrscheinlichkeit des Ereignisses von den anderen Prädiktoren im Term abhängt.
  • Wenn ein Polynomialterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Wahrscheinlichkeit des Ereignisses von der Größe des Prädiktors abhängt.
Abweichungstabelle Quelle DF Kor Abw Kor MW Chi-Quadrat p-Wert Regression 1 22,7052 22,7052 22,71 0,000 Dosis (mg) 1 22,7052 22,7052 22,71 0,000 Fehler 4 0,9373 0,2343 Gesamt 5 23,6425
Koeffizienten Term Koef SE Koef VIF Konstante -5,25 1,99 Dosis (mg) 3,63 1,30 1,00
Chancenverhältnisse für stetige Prädiktoren Chancenverhältnis 95%-KI Dosis (mg) 37,5511 (2,9645; 475,6528)
Wichtigste Ergebnisse: p-Wert, Koeffizienten

In diesen Ergebnissen ist die Dosierung auf einem Signifikanzniveau von 0,05 statistisch signifikant. Sie können schlussfolgern, dass Änderungen bei der Dosierung mit Änderungen der Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.

Werten Sie den Koeffizienten aus, um zu ermitteln, ob eine Änderung bei einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, einschließlich der Linkfunktion. Positive Koeffizienten weisen in der Regel darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem zunehmenden Prädiktor steigt. Negative Koeffizienten weisen darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem abnehmenden Prädiktor sinkt. Weitere Informationen finden Sie unter Koeffizienten und Regressionsgleichung für Binäres logistisches Modell anpassen.

Der Koeffizient für die Dosierung beträgt 3,63, was darauf hindeutet, dass höhere Dosierungen mit einer größeren Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.

Wenn ein Wechselwirkungsterm statistisch signifikant ist, weicht die Beziehung zwischen einem Prädiktor und der Antwortvariablen um die Stufe des anderen Prädiktors ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen. Um ein besseres Verständnis der Haupteffekte, der Wechselwirkungseffekte und der Krümmung im Modell zu erlangen, wählen Sie Faktordiagramme und Zielgrößenoptimierung aus.

Schritt 2: Verstehen der Effekte der Prädiktoren

Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen stetigen oder einen kategorialen Prädiktor handelt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.
Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.

Binäre Logistische Regression: Keine Bakterien vs. Dosis (mg)

Chancenverhältnisse für stetige Prädiktoren Änderungseinheit Chancenverhältnis 95%-KI Dosis (mg) 0,5 6,1279 (1,7218; 21,8095)
Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.

Chancenverhältnisse für kategoriale Prädiktoren

Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 deuten darauf hin, dass das Ereignis auf Stufe B weniger wahrscheinlich ist. Chancenverhältnisse kleiner als 1 deuten darauf hin, dass das Ereignis auf Stufe B wahrscheinlicher ist. Weitere Informationen zum Auswählen der Referenzstufe für die Analyse finden Sie unter Angeben des Kodierungsschemas für Binäres logistisches Modell anpassen.

Binäre Logistische Regression: Cancellation vs. Monat

Chancenverhältnisse für kategoriale Prädiktoren Stufe A Stufe B Chancenverhältnis 95%-KI Monat 2 1 1,1250 (0,0600; 21,0867) 3 1 3,3750 (0,2897; 39,3222) 4 1 7,7143 (0,7460; 79,7712) 5 1 2,2500 (0,1107; 45,7226) 6 1 6,0000 (0,5322; 67,6495) 3 2 3,0000 (0,2547; 35,3340) 4 2 6,8571 (0,6556; 71,7201) 5 2 2,0000 (0,0976; 41,0034) 6 2 5,3333 (0,4679; 60,7972) 4 3 2,2857 (0,4103; 12,7323) 5 3 0,6667 (0,0514; 8,6389) 6 3 1,7778 (0,2842; 11,1200) 5 4 0,2917 (0,0252; 3,3719) 6 4 0,7778 (0,1464; 4,1326) 6 5 2,6667 (0,2124; 33,4861) Chancenverhältnis für Stufe A relativ zu Stufe B
Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen ist der kategoriale Prädiktor der Monat, in dem die Hochsaison eines Hotels beginnt. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. Das größte Chancenverhältnis beträgt etwa 8, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.

Weitere Informationen finden Sie unter Chancenverhältnisse für Binäres logistisches Modell anpassen.

Schritt 3: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken in der Tabelle „Zusammenfassung des Modells“.

Für die binäre logistische Regression wirkt sich das Datenformat auf die meisten Statistiken für die Zusammenfassung des Modells und die Güte der Anpassung aus. Der AIC-Test und der Hosmer-Lemeshow-Test werden durch das Datenformat nicht beeinflusst, somit können Vergleiche auch bei unterschiedlichen Formaten vorgenommen werden. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

R-Qd der Abweichung

Je höher das R2 der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R2 der Abweichung liegt immer zwischen 0 % und 100 %.

Das R2 der Abweichung nimmt beim Einbinden zusätzlicher Prädiktoren in ein Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist das R2 der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

Für die binäre logistische Regression beeinflusst das Format der Daten den Wert des R2 der Abweichung. Im Allgemeinen ist das R2 der Abweichung für Daten im Ereignis-/Versuchsformat höher. Werte des R2 der Abweichung sind nur zwischen Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.

R2 der Abweichung ist nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell ein hohes R2 aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

R-Qd(kor) der Abweichung

Verwenden Sie das korrigierte R2 der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. Das R2 der Abweichung nimmt beim Einbinden eines Prädiktors in ein Modell stets zu. Der Wert des korrigierten R2 der Abweichung berücksichtigt die Anzahl der Prädiktoren im Modell, was die Auswahl des richtigen Modells erleichtert.

AIC

Verwenden Sie das AIC, um unterschiedliche Modelle zu vergleichen. Je kleiner das AIC, desto besser ist das Modell an die Daten angepasst. Das Modell mit dem kleinsten AIC für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch mit den Tests auf Güte der Anpassung und Residuendiagrammen, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Zusammenfassung des Modells R-Qd(kor) R-Qd der der Abweichung Abweichung AIC 96,04% 91,81% 21,68
Wichtigste Ergebnisse: R-Qd der Abweichung, R-Qd(kor) der Abweichung, AIC

In diesen Ergebnissen erklärt das Modell 96,04 % der Abweichung in der Antwortvariablen. Für diese Daten gibt das R2 der Abweichung an, dass das Modell gut an die Daten angepasst ist. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R2 der Abweichung und das AIC, um zu vergleichen, wie gut die Modelle an die Daten angepasst sind.

Schritt 4: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Bei der binären logistischen Regression wirkt sich das Format der Daten auf den p-Wert aus, da je nach Format unterschiedliche Anzahlen von Versuchen pro Zeile vorliegen.

  • Abweichung: Der p-Wert für den Abweichungstest ist für Daten im binären Antwort-/Häufigkeitenformat tendenziell niedriger als für Daten im Ereignis-/Versuchsformat. Für Daten im binären Antwort-/Häufigkeitenformat sind die Ergebnisse des Hosmer-Lemeshow-Tests zuverlässiger.
  • Pearson: Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im binären Antwort-/Häufigkeitenformat vorliegen.
  • Hosmer-Lemeshow: Der Hosmer-Lemeshow-Test hängt nicht von der Anzahl der Versuche pro Zeile in den Daten ab, wie dies bei anderen Tests auf Güte der Anpassung der Fall ist. Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar.
Response Information Event Variable Value Count Name Event Event 160 Event Non-event 340 Trial Total 500
Goodness-of-Fit Tests Test DF Chi-Square P-Value Deviance 2 3.78 0.151 Pearson 2 3.76 0.152 Hosmer-Lemeshow 3 3.76 0.288
Wichtigste Ergebnisse für das Ereignis-/Versuchsformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnissen werden in der Tabelle mit Informationen zur Antwortvariablen „Ereignis“ und „Versuch“ in der Spalte „Variable“ angezeigt. Diese Beschriftungen zeigen an, dass die Daten im Ereignis-/Versuchsformat vorliegen. Alle Tests auf Güte der Anpassung weisen p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.

Response Information Variable Value Count Y Event 160 (Event) Non-event 340 Total 500
Goodness-of-Fit Tests Test DF Chi-Square P-Value Deviance 497 552.03 0.044 Pearson 497 504.42 0.399 Hosmer-Lemeshow 3 3.76 0.288
Wichtigste Ergebnisse für das binäre Antwort-/Häufigkeitenformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnissen für dieselben Daten wird in der Tabelle mit Informationen zur Antwortvariablen der Wert „Y“ in der Spalte „Variable“ angezeigt. Diese Beschriftung zeigt an, dass die Daten im binären Antwort-/Häufigkeitenformat vorliegen. Der Abweichungstest weist einen p-Wert auf, der kleiner als das übliche Signifikanzniveau 0,05 ist, aber der Hosmer-Lemeshow-Test ist der zuverlässigste Test. Der Hosmer-Lemeshow-Test liefert keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien