Wald-Test | |||
---|---|---|---|
Quelle | DF | Chi-Quadrat | p-Wert |
Regression | 1 | 7,83 | 0,005 |
Dosis (mg) | 1 | 7,83 | 0,005 |
Term | Koef | SE Koef | z-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | -5,25 | 1,99 | -2,64 | 0,008 | |
Dosis (mg) | 3,63 | 1,30 | 2,80 | 0,005 | 1,00 |
In diesen Ergebnissen ist die Dosierung auf einem Signifikanzniveau von 0,05 statistisch signifikant. Sie können schlussfolgern, dass Änderungen bei der Dosierung mit Änderungen der Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.
Werten Sie den Koeffizienten aus, um zu ermitteln, ob eine Änderung bei einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, einschließlich der Linkfunktion. Positive Koeffizienten weisen in der Regel darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem zunehmenden Prädiktor steigt. Negative Koeffizienten weisen darauf hin, dass die Wahrscheinlichkeit für das Ereignis bei einem abnehmenden Prädiktor sinkt. Weitere Informationen finden Sie unter Koeffizienten und Regressionsgleichung für Binäres logistisches Modell anpassen und Binäre logistische Regression.
Der Koeffizient für die Dosierung beträgt 3,63, was darauf hindeutet, dass höhere Dosierungen mit einer größeren Wahrscheinlichkeit, dass das Ereignis eintritt, verbunden sind.
Wenn ein Wechselwirkungsterm statistisch signifikant ist, weicht die Beziehung zwischen einem Prädiktor und der Antwortvariablen um die Stufe des anderen Prädiktors ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen. Um ein besseres Verständnis der Haupteffekte, der Wechselwirkungseffekte und der Krümmung im Modell zu erlangen, wählen Sie Faktordiagramme und Zielgrößenoptimierung aus.
Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.
Änderungseinheit | Chancenverhältnis | 95%-KI | |
---|---|---|---|
Dosis (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. In diesem Beispiel stellt das Nichtvorhandensein von Bakterien das Ereignis dar. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.
Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis auf Stufe A wahrscheinlicher ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis auf Stufe A weniger wahrscheinlich ist. Weitere Informationen zur Kodierung von kategorialen Prädiktoren finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.
Stufe A | Stufe B | Chancenverhältnis | 95%-KI |
---|---|---|---|
Monat | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
In diesen Ergebnissen ist der kategoriale Prädiktor der Monat ab dem Beginn der Hochsaison eines Hotels. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. In diesem Beispiel stellt die Stornierung das Ereignis dar. Das größte Chancenverhältnis beträgt etwa 7,71, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.
Weitere Informationen finden Sie unter Chancenverhältnis für Binäres logistisches Modell anpassen und Binäre logistische Regression.
Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken in der Tabelle „Zusammenfassung des Modells“.
Viele Statistiken zur Übersicht des Modells und zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der Hosmer-Lemeshow-Test wird durch das Datenformat nicht beeinflusst, daher können Vergleiche auch bei unterschiedlichen Formaten vorgenommen werden. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.
Je höher das R2 der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R2 der Abweichung liegt immer zwischen 0 % und 100 %.
Das R2 der Abweichung nimmt beim Einbinden zusätzlicher Prädiktoren in ein Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist das R2 der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.
Für die binäre logistische Regression beeinflusst das Format der Daten den Wert des R2 der Abweichung. Im Allgemeinen ist das R2 der Abweichung für Daten im Ereignis-/Versuchsformat höher. Werte des R2 der Abweichung sind nur bei Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.
Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.
Verwenden Sie das korrigierte R2 der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. Das R2 der Abweichung nimmt beim Einbinden eines Prädiktors in ein Modell stets zu. Der Wert des korrigierten R2 der Abweichung berücksichtigt die Anzahl der Prädiktoren im Modell, was die Auswahl des richtigen Modells erleichtert.
Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.
Die Fläche unter der ROC-Kurve kann Werte von 0,5 bis 1 annehmen. Wenn das binäre Modell die Klassen perfekt trennen kann, entspricht die Fläche unter der Kurve 1. Wenn das binäre Modell die Klassen nicht besser als eine zufällige Einteilung trennen kann, entspricht die Fläche unter der Kurve 0,5.
R-Qd der Abweichung | R-Qd(kor) der Abweichung | AIC | AICc | BIC | Fläche unter der ROC-Kurve |
---|---|---|---|---|---|
96,04% | 91,81% | 10,63 | 14,63 | 10,22 | 0,9398 |
In diesen Ergebnissen erklärt das Modell 96,04 % der Gesamtabweichung in der Antwortvariablen. Für diese Daten gibt das R2 der Abweichung an, dass das Modell gut für die Daten passend ist. Die Fläche unterhalb der ROC-Kurve beträgt 0,9398. Dieser Wert gibt an, dass das Modell einen Großteil der Daten richtig klassifiziert. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R2 der Abweichung sowie das AIC, das AICc, das BIC und die Fläche unterhalb der ROC-Kurve, um zu vergleichen, wie gut die Modelle für die Daten passend sind.
Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.
Bei der binären logistischen Regression wirkt sich das Format der Daten auf den p-Wert aus, da je nach Format unterschiedliche Anzahlen von Versuchen pro Zeile vorliegen.
Variable | Wert | Anzahl | Ereignisbezeichnung |
---|---|---|---|
Event | Ereignis | 160 | Ereignis |
Nicht-Ereignis | 340 | ||
Trial | Gesamt | 500 |
Test | DF | Chi-Quadrat | p-Wert |
---|---|---|---|
Abweichung | 2 | 3,78 | 0,151 |
Pearson | 2 | 3,76 | 0,152 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
In diesen Ergebnissen werden in der Tabelle mit Informationen zur Antwortvariablen „Ereignis“ und „Versuch“ in der Spalte „Variable“ angezeigt. Diese Beschriftungen zeigen an, dass die Daten im Ereignis-/Versuchsformat vorliegen. Alle Tests auf Güte der Anpassung weisen p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.
Variable | Wert | Anzahl | |
---|---|---|---|
Y | Event | 160 | (Ereignis) |
Non-event | 340 | ||
Gesamt | 500 |
Test | DF | Chi-Quadrat | p-Wert |
---|---|---|---|
Abweichung | 497 | 552,03 | 0,044 |
Pearson | 497 | 504,42 | 0,399 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
In diesen Ergebnissen für dieselben Daten wird in der Tabelle mit Informationen zur Antwortvariablen der Wert „Y“ in der Spalte „Variable“ angezeigt. Diese Beschriftung zeigt an, dass die Daten im binären Antwort-/Häufigkeitenformat vorliegen. Der Abweichungstest weist einen p-Wert auf, der kleiner als das übliche Signifikanzniveau 0,05 ist, aber der Hosmer-Lemeshow-Test ist der zuverlässigste Test. Der Hosmer-Lemeshow-Test liefert keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.
Überlagerte Konturdiagramme sind verfügbar, wenn Sie ein Modell im Statistik Menü anpassen.