Interpretieren Sie die Schlüsselergebnisse für Binäres logistisches Modell anpassenund Binäre logistische Regression

Führen Sie die folgenden Schritte aus, um ein binäres logistisches Modell zu interpretieren. Zu den wichtigsten Ausgaben gehören der p-Wert, die Koeffizienten, R² und die Anpassungsgütetests.

In diesem Thema

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist
Schritt 2: Verstehen der Effekte der Prädiktoren
Schritt 3: Bestimmen, wie gut das Modell an die Daten angepasst ist
Schritt 4: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist
Schritt 5: Verwenden Sie das angepasste Modell

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.

p-Wert ≤ α: Die Assoziation ist statistisch signifikant: Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant: Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.; Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.

Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:

Wenn ein stetiger Prädiktor signifikant ist, können Sie schlussfolgern, dass sich der Koeffizient für den Prädiktor von null unterscheidet.
Wenn ein kategorialer Prädiktor signifikant ist, können Sie schlussfolgern, dass nicht alle Stufen des Faktors die gleiche Wahrscheinlichkeit aufweisen.
Wenn ein Wechselwirkungsterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Wahrscheinlichkeit des Ereignisses von den anderen Prädiktoren im Term abhängt.
Wenn ein Polynomialterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Wahrscheinlichkeit des Ereignisses von der Größe des Prädiktors abhängt.

Varianzanalyse

		Wald-Test
Quelle	DF	Chi-Quadrat	p-Wert
Regression	1	7,83	0,005
Dosis (mg)	1	7,83	0,005

Koeffizienten

Term	Koef	SE Koef	z-Wert	p-Wert	VIF
Konstante	-5,25	1,99	-2,64	0,008
Dosis (mg)	3,63	1,30	2,80	0,005	1,00

Wichtigste Ergebnisse: p-Wert, Koeffizienten

In diesen Ergebnissen ist die Dosierung auf einem Signifikanzniveau von 0,05 statistisch signifikant. Sie können schlussfolgern, dass Änderungen bei der Dosierung mit Änderungen der Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.

Werten Sie den Koeffizienten aus, um zu ermitteln, ob eine Änderung bei einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, einschließlich der Linkfunktion. Positive Koeffizienten weisen in der Regel darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem zunehmenden Prädiktor steigt. Negative Koeffizienten weisen darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem abnehmenden Prädiktor sinkt. Weitere Informationen finden Sie unter Koeffizienten und Regressionsgleichung für Binäres logistisches Modell anpassen und Binäre logistische Regression.

Der Koeffizient für die Dosierung beträgt 3,63, was darauf hindeutet, dass höhere Dosierungen mit einer größeren Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.

Wenn ein Wechselwirkungsterm statistisch signifikant ist, weicht die Beziehung zwischen einem Prädiktor und der Antwortvariablen um die Stufe des anderen Prädiktors ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen. Um ein besseres Verständnis der Haupteffekte, der Wechselwirkungseffekte und der Krümmung im Modell zu erlangen, wählen Sie Faktordiagramme und Zielgrößenoptimierung aus.

Schritt 2: Verstehen der Effekte der Prädiktoren

Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen stetigen oder einen kategorialen Prädiktor handelt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.

Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.

Chancenverhältnisse für stetige Prädiktoren

	Änderungseinheit	Chancenverhältnis	95%-KI
Dosis (mg)	0,5	6,1279	(1,7218; 21,8087)

Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. In diesem Beispiel stellt das Nichtvorhandensein von Bakterien das Ereignis dar. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.

Chancenverhältnisse für kategoriale Prädiktoren

Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis auf Stufe A wahrscheinlicher ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis auf Stufe A weniger wahrscheinlich ist. Weitere Informationen zur Kodierung von kategorialen Prädiktoren finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.

Binäre Logistische Regression: Cancellation vs. Monat

Chancenverhältnisse für kategoriale Prädiktoren

Stufe A	Stufe B	Chancenverhältnis	95%-KI
Monat
2	1	1,1250	(0,0600; 21,0834)
3	1	3,3750	(0,2897; 39,3165)
4	1	7,7143	(0,7461; 79,7592)
5	1	2,2500	(0,1107; 45,7172)
6	1	6,0000	(0,5322; 67,6397)
3	2	3,0000	(0,2547; 35,3325)
4	2	6,8571	(0,6556; 71,7169)
5	2	2,0000	(0,0976; 41,0019)
6	2	5,3333	(0,4679; 60,7946)
4	3	2,2857	(0,4103; 12,7323)
5	3	0,6667	(0,0514; 8,6389)
6	3	1,7778	(0,2842; 11,1200)
5	4	0,2917	(0,0252; 3,3719)
6	4	0,7778	(0,1464; 4,1326)
6	5	2,6667	(0,2124; 33,4861)

Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen ist der kategoriale Prädiktor der Monat ab dem Beginn der Hochsaison eines Hotels. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. In diesem Beispiel stellt die Stornierung das Ereignis dar. Das größte Chancenverhältnis beträgt etwa 7,71, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.

Weitere Informationen finden Sie unter Chancenverhältnis für Binäres logistisches Modell anpassen und Binäre logistische Regression.

Schritt 3: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken in der Tabelle „Zusammenfassung des Modells“.

Viele Statistiken zur Übersicht des Modells und zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der Hosmer-Lemeshow-Test wird durch das Datenformat nicht beeinflusst, daher können Vergleiche auch bei unterschiedlichen Formaten vorgenommen werden. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

R-Qd der Abweichung

Je höher das R² der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R² der Abweichung liegt immer zwischen 0 % und 100 %.

Das R² der Abweichung nimmt beim Einbinden zusätzlicher Prädiktoren in ein Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R² auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist das R² der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

Für die binäre logistische Regression beeinflusst das Format der Daten den Wert des R² der Abweichung. Im Allgemeinen ist das R² der Abweichung für Daten im Ereignis-/Versuchsformat höher. Werte des R² der Abweichung sind nur bei Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.

Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

R-Qd(kor) der Abweichung

Verwenden Sie das korrigierte R² der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. Das R² der Abweichung nimmt beim Einbinden eines Prädiktors in ein Modell stets zu. Der Wert des korrigierten R² der Abweichung berücksichtigt die Anzahl der Prädiktoren im Modell, was die Auswahl des richtigen Modells erleichtert.

AIC, AICc und BIC

Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Fläche unterhalb der ROC-Kurve

Die Fläche unter der ROC-Kurve kann Werte von 0,5 bis 1 annehmen. Wenn das binäre Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das binäre Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.

Zusammenfassung des Modells

R-Qd der Abweichung	R-Qd(kor) der Abweichung	AIC	AICc	BIC	Fläche unter der ROC-Kurve
96,04%	91,81%	10,63	14,63	10,22	0,9398

Wichtigste Ergebnisse: R-Qd der Abweichung, R-Qd(kor) der Abweichung, AIC, Fläche unterhalb der ROC-Kurve

In diesen Ergebnissen erklärt das Modell 96,04 % der Gesamtabweichung in der Antwortvariablen. Für diese Daten gibt das R² der Abweichung an, dass das Modell gut für die Daten passend ist. Die Fläche unterhalb der ROC-Kurve beträgt 0,9398. Dieser Wert gibt an, dass das Modell einen Großteil der Daten richtig klassifiziert. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R² der Abweichung sowie das AIC, das AICc, das BIC und die Fläche unterhalb der ROC-Kurve, um zu vergleichen, wie gut die Modelle für die Daten passend sind.

Schritt 4: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:

Falsche Linkfunktion
Fehlender Term höherer Ordnung für Variablen im Modell
Fehlender Prädiktor, der nicht im Modell enthalten ist
Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Bei der binären logistischen Regression wirkt sich das Format der Daten auf den p-Wert aus, da je nach Format unterschiedliche Anzahlen von Versuchen pro Zeile vorliegen.

Abweichung: Der p-Wert für den Abweichungstest ist für Daten im binären Antwort-/Häufigkeitenformat tendenziell niedriger als für Daten im Ereignis-/Versuchsformat. Für Daten im binären Antwort-/Häufigkeitenformat sind die Ergebnisse des Hosmer-Lemeshow-Tests zuverlässiger.
Pearson: Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im binären Antwort-/Häufigkeitenformat vorliegen.
Hosmer-Lemeshow: Der Hosmer-Lemeshow-Test hängt nicht von der Anzahl der Versuche pro Zeile in den Daten ab, wie dies bei anderen Tests auf Güte der Anpassung der Fall ist.Wenn die Daten eine kleine Anzahl von Versuchen pro Zeile aufweisen, stellt der Hosmer-Lemeshow-Test einen zuverlässigeren Beleg für die Güte der Anpassung des Modells an die Daten dar.

Informationen zur Antwortvariablen

Variable	Wert	Anzahl	Ereignisbezeichnung
Event	Ereignis	160	Ereignis
	Nicht-Ereignis	340
Trial	Gesamt	500

Tests auf Güte der Anpassung

Test	DF	Chi-Quadrat	p-Wert
Abweichung	2	3,78	0,151
Pearson	2	3,76	0,152
Hosmer-Lemeshow	3	3,76	0,288

Wichtigste Ergebnisse für das Ereignis-/Versuchsformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnissen werden in der Tabelle mit Informationen zur Antwortvariablen „Ereignis“ und „Versuch“ in der Spalte „Variable“ angezeigt. Diese Beschriftungen zeigen an, dass die Daten im Ereignis-/Versuchsformat vorliegen. Alle Tests auf Güte der Anpassung weisen p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.

Informationen zur Antwortvariablen

Variable	Wert	Anzahl
Y	Event	160	(Ereignis)
	Non-event	340
	Gesamt	500

Tests auf Güte der Anpassung

Test	DF	Chi-Quadrat	p-Wert
Abweichung	497	552,03	0,044
Pearson	497	504,42	0,399
Hosmer-Lemeshow	3	3,76	0,288

Wichtigste Ergebnisse für das binäre Antwort-/Häufigkeitenformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnissen für dieselben Daten wird in der Tabelle mit Informationen zur Antwortvariablen der Wert „Y“ in der Spalte „Variable“ angezeigt. Diese Beschriftung zeigt an, dass die Daten im binären Antwort-/Häufigkeitenformat vorliegen. Der Abweichungstest weist einen p-Wert auf, der kleiner als das übliche Signifikanzniveau 0,05 ist, aber der Hosmer-Lemeshow-Test ist der zuverlässigste Test. Der Hosmer-Lemeshow-Test liefert keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.

Schritt 5: Verwenden Sie das angepasste Modell

Nachdem Sie ein Modell angepasst haben, können Sie schnell und einfach Diagramme erstellen, Vorhersagen treffen und Reaktionen optimieren. Um weitere Informationen zu erhalten, wählen Sie eine Analyse aus der folgenden Liste aus:

Hinweis

Überlagerte Konturdiagramme sind verfügbar, wenn Sie ein Modell im Statistik Menü anpassen.