Interpretieren der wichtigsten Ergebnisse für Binäres logistisches Modell anpassen

Führen Sie die folgenden Schritte aus, um ein binäres logistisches Modell zu interpretieren. Zu den wichtigsten Ausgaben zählen der p-Wert, die Koeffizienten, das R2 und die Tests auf Güte der Anpassung.

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein stetiger Prädiktor signifikant ist, können Sie schlussfolgern, dass sich der Koeffizient für den Prädiktor von null unterscheidet.
  • Wenn ein kategorialer Prädiktor signifikant ist, können Sie schlussfolgern, dass nicht alle Stufen des Faktors die gleiche Wahrscheinlichkeit aufweisen.
  • Wenn ein Wechselwirkungsterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Wahrscheinlichkeit des Ereignisses von den anderen Prädiktoren im Term abhängt.
  • Wenn ein Polynomialterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Wahrscheinlichkeit des Ereignisses von der Größe des Prädiktors abhängt.

Varianzanalyse



Wald-Test
QuelleDFChi-Quadratp-Wert
Regression17,830,005
  Dosis (mg)17,830,005

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante-5,251,99-2,640,008 
Dosis (mg)3,631,302,800,0051,00
Wichtigste Ergebnisse: p-Wert, Koeffizienten

In diesen Ergebnissen ist die Dosierung auf einem Signifikanzniveau von 0,05 statistisch signifikant. Sie können schlussfolgern, dass Änderungen bei der Dosierung mit Änderungen der Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.

Werten Sie den Koeffizienten aus, um zu ermitteln, ob eine Änderung bei einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, einschließlich der Linkfunktion. Positive Koeffizienten weisen in der Regel darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem zunehmenden Prädiktor steigt. Negative Koeffizienten weisen darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem abnehmenden Prädiktor sinkt. Weitere Informationen finden Sie unter Koeffizienten und Regressionsgleichung für Binäres logistisches Modell anpassen.

Der Koeffizient für die Dosierung beträgt 3,63, was darauf hindeutet, dass höhere Dosierungen mit einer größeren Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.

Wenn ein Wechselwirkungsterm statistisch signifikant ist, weicht die Beziehung zwischen einem Prädiktor und der Antwortvariablen um die Stufe des anderen Prädiktors ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen. Um ein besseres Verständnis der Haupteffekte, der Wechselwirkungseffekte und der Krümmung im Modell zu erlangen, wählen Sie Faktordiagramme und Zielgrößenoptimierung aus.

Schritt 2: Verstehen der Effekte der Prädiktoren

Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen stetigen oder einen kategorialen Prädiktor handelt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.
Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.

Chancenverhältnisse für stetige Prädiktoren

ÄnderungseinheitChancenverhältnis95%-KI
Dosis (mg)0,56,1279(1,7218; 21,8087)
Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. In diesem Beispiel stellt das Nichtvorhandensein von Bakterien das Ereignis dar. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.

Chancenverhältnisse für kategoriale Prädiktoren

Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis auf Stufe A wahrscheinlicher ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis auf Stufe A weniger wahrscheinlich ist. Weitere Informationen zur Kodierung von kategorialen Prädiktoren finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.

Binäre Logistische Regression: Cancellation vs. Monat

Chancenverhältnisse für kategoriale Prädiktoren

Stufe AStufe BChancenverhältnis95%-KI
Monat     
  211,1250(0,0600; 21,0834)
  313,3750(0,2897; 39,3165)
  417,7143(0,7461; 79,7592)
  512,2500(0,1107; 45,7172)
  616,0000(0,5322; 67,6397)
  323,0000(0,2547; 35,3325)
  426,8571(0,6556; 71,7169)
  522,0000(0,0976; 41,0019)
  625,3333(0,4679; 60,7946)
  432,2857(0,4103; 12,7323)
  530,6667(0,0514; 8,6389)
  631,7778(0,2842; 11,1200)
  540,2917(0,0252; 3,3719)
  640,7778(0,1464; 4,1326)
  652,6667(0,2124; 33,4861)
Chancenverhältnis für Stufe A relativ zu Stufe B
Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen ist der kategoriale Prädiktor der Monat ab dem Beginn der Hochsaison eines Hotels. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. In diesem Beispiel stellt die Stornierung das Ereignis dar. Das größte Chancenverhältnis beträgt etwa 7,71, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.

Weitere Informationen finden Sie unter Chancenverhältnisse für Binäres logistisches Modell anpassen.

Schritt 3: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken in der Tabelle „Zusammenfassung des Modells“.

Viele Statistiken zur Übersicht des Modells und zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der Hosmer-Lemeshow-Test wird durch das Datenformat nicht beeinflusst, daher können Vergleiche auch bei unterschiedlichen Formaten vorgenommen werden. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

R-Qd der Abweichung

Je höher das R2 der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R2 der Abweichung liegt immer zwischen 0 % und 100 %.

Das R2 der Abweichung nimmt beim Einbinden zusätzlicher Prädiktoren in ein Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist das R2 der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

Für die binäre logistische Regression beeinflusst das Format der Daten den Wert des R2 der Abweichung. Im Allgemeinen ist das R2 der Abweichung für Daten im Ereignis-/Versuchsformat höher. Werte des R2 der Abweichung sind nur bei Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.

Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

R-Qd(kor) der Abweichung

Verwenden Sie das korrigierte R2 der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. Das R2 der Abweichung nimmt beim Einbinden eines Prädiktors in ein Modell stets zu. Der Wert des korrigierten R2 der Abweichung berücksichtigt die Anzahl der Prädiktoren im Modell, was die Auswahl des richtigen Modells erleichtert.

AIC, AICc und BIC

Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Fläche unterhalb der ROC-Kurve

Die Fläche unter der ROC-Kurve kann Werte von 0,5 bis 1 annehmen. Wenn das binäre Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das binäre Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.

Zusammenfassung des Modells

R-Qd der
Abweichung
R-Qd(kor)
der
Abweichung
AICAICcBICFläche unter
der ROC-Kurve
96,04%91,81%10,6314,6310,220,9398
Wichtigste Ergebnisse: R-Qd der Abweichung, R-Qd(kor) der Abweichung, AIC, Fläche unterhalb der ROC-Kurve

In diesen Ergebnissen erklärt das Modell 96,04 % der Gesamtabweichung in der Antwortvariablen. Für diese Daten gibt das R2 der Abweichung an, dass das Modell gut für die Daten passend ist. Die Fläche unterhalb der ROC-Kurve beträgt 0,9398. Dieser Wert gibt an, dass das Modell einen Großteil der Daten richtig klassifiziert. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R2 der Abweichung sowie das AIC, das AICc, das BIC und die Fläche unterhalb der ROC-Kurve, um zu vergleichen, wie gut die Modelle für die Daten passend sind.

Schritt 4: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Bei der binären logistischen Regression wirkt sich das Format der Daten auf den p-Wert aus, da je nach Format unterschiedliche Anzahlen von Versuchen pro Zeile vorliegen.

  • Abweichung: Der p-Wert für den Abweichungstest ist für Daten im binären Antwort-/Häufigkeitenformat tendenziell niedriger als für Daten im Ereignis-/Versuchsformat. Für Daten im binären Antwort-/Häufigkeitenformat sind die Ergebnisse des Hosmer-Lemeshow-Tests zuverlässiger.
  • Pearson: Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im binären Antwort-/Häufigkeitenformat vorliegen.
  • Hosmer-Lemeshow: Der Hosmer-Lemeshow-Test hängt nicht von der Anzahl der Versuche pro Zeile in den Daten ab, wie dies bei anderen Tests auf Güte der Anpassung der Fall ist.Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar.

Informationen zur Antwortvariablen

VariableWertAnzahlEreignisbezeichnung
EventEreignis160Ereignis
  Nicht-Ereignis340 
TrialGesamt500 

Tests auf Güte der Anpassung

TestDFChi-Quadratp-Wert
Abweichung23,780,151
Pearson23,760,152
Hosmer-Lemeshow33,760,288
Wichtigste Ergebnisse für das Ereignis-/Versuchsformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnissen werden in der Tabelle mit Informationen zur Antwortvariablen „Ereignis“ und „Versuch“ in der Spalte „Variable“ angezeigt. Diese Beschriftungen zeigen an, dass die Daten im Ereignis-/Versuchsformat vorliegen. Alle Tests auf Güte der Anpassung weisen p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.

Informationen zur Antwortvariablen

VariableWertAnzahl
YEvent160(Ereignis)
  Non-event340 
  Gesamt500 

Tests auf Güte der Anpassung

TestDFChi-Quadratp-Wert
Abweichung497552,030,044
Pearson497504,420,399
Hosmer-Lemeshow33,760,288
Wichtigste Ergebnisse für das binäre Antwort-/Häufigkeitenformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnissen für dieselben Daten wird in der Tabelle mit Informationen zur Antwortvariablen der Wert „Y“ in der Spalte „Variable“ angezeigt. Diese Beschriftung zeigt an, dass die Daten im binären Antwort-/Häufigkeitenformat vorliegen. Der Abweichungstest weist einen p-Wert auf, der kleiner als das übliche Signifikanzniveau 0,05 ist, aber der Hosmer-Lemeshow-Test ist der zuverlässigste Test. Der Hosmer-Lemeshow-Test liefert keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.