Verwenden Sie ein Pareto-Diagramm der standardisierten Effekte, um die relative Größe und die statistische Signifikanz von Haupteffekten, quadratischen Effekten und Wechselwirkungseffekten zu vergleichen.
Minitab stellt die standardisierten Effekte in absteigender Reihenfolge ihrer Absolutwerte dar. Die Referenzlinie im Diagramm zeigt, welche Effekte signifikant sind. In der Standardeinstellung zeichnet Minitab die Referenzlinie bei einem Signifikanzniveau von 0,05.
Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist, was bedeutet, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
Term | Koef | SE Koef | VIF |
---|---|---|---|
Konstante | 3,021 | 0,384 | |
Zeit | 0,210 | 0,139 | 18,53 |
Temperatur | 0,641 | 0,159 | 19,53 |
Druck | 0,420 | 0,211 | 70,48 |
Zeit*Zeit | -0,0735 | 0,0482 | 1,01 |
Temperatur*Temperatur | 0,2988 | 0,0517 | 1,17 |
Druck*Druck | -0,0022 | 0,0277 | 70,24 |
Zeit*Temperatur | -0,0092 | 0,0505 | 1,14 |
Zeit*Druck | 0,0417 | 0,0342 | 18,12 |
Temperatur*Druck | -0,0521 | 0,0396 | 19,24 |
In diesen Ergebnissen sind die Koeffizienten für die Haupteffekte von Zeit, Temperatur und Druck positive Zahlen. Der Koeffizient für den quadrierten Term Zeit*Zeit ist eine negative Zahl. Im Allgemeinen gilt bei einem zunehmenden Wert des Terms: Positive Koeffizienten steigern die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern.
Quelle | DF | Kor Abw | Kor MW | Chi-Quadrat | p-Wert |
---|---|---|---|---|---|
Modell | 9 | 903,478 | 100,386 | 903,48 | 0,000 |
Zeit | 1 | 2,303 | 2,303 | 2,30 | 0,129 |
Temperatur | 1 | 16,388 | 16,388 | 16,39 | 0,000 |
Druck | 1 | 3,966 | 3,966 | 3,97 | 0,046 |
Zeit*Zeit | 1 | 2,331 | 2,331 | 2,33 | 0,127 |
Temperatur*Temperatur | 1 | 34,012 | 34,012 | 34,01 | 0,000 |
Druck*Druck | 1 | 0,006 | 0,006 | 0,01 | 0,937 |
Zeit*Temperatur | 1 | 0,033 | 0,033 | 0,03 | 0,856 |
Zeit*Druck | 1 | 1,490 | 1,490 | 1,49 | 0,222 |
Temperatur*Druck | 1 | 1,731 | 1,731 | 1,73 | 0,188 |
Fehler | 5 | 23,404 | 4,681 | ||
Gesamt | 14 | 926,882 |
In diesen Ergebnissen sind der quadrierte Term Temperatur*Temperatur und die Haupteffekte für Temperatur und Druck beim Signifikanzniveau α = 0,05 signifikant.
Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.
Änderungseinheit | Chancenverhältnis | 95%-KI | |
---|---|---|---|
Dosis (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. In diesem Beispiel stellt das Nichtvorhandensein von Bakterien das Ereignis dar. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.
Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis auf Stufe A wahrscheinlicher ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis auf Stufe A weniger wahrscheinlich ist. Weitere Informationen zur Kodierung von kategorialen Prädiktoren finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.
Stufe A | Stufe B | Chancenverhältnis | 95%-KI |
---|---|---|---|
Monat | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
In diesen Ergebnissen ist der kategoriale Prädiktor der Monat ab dem Beginn der Hochsaison eines Hotels. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. In diesem Beispiel stellt die Stornierung das Ereignis dar. Das größte Chancenverhältnis beträgt etwa 7,71, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.
Viele Statistiken zur Übersicht des Modells und zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der Hosmer-Lemeshow-Test wird durch die Anordnung der Daten nicht beeinflusst und liefert bei einem Versuch pro Zeile ähnliche Ergebnisse wie bei mehreren Versuchen pro Zeile. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.
Je höher das R2 der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R2 der Abweichung liegt immer zwischen 0 % und 100 %.
Das R2 der Abweichung nimmt beim Einbinden zusätzlicher Terme in ein Modell stets zu. Das beste Modell mit fünf Termen weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Termen ist. Daher ist das R2 der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.
Die Anordnung der Daten beeinflusst den Wert des R2 der Abweichung. Das R2 der Abweichung ist bei Daten mit mehreren Versuchen pro Zeile in der Regel höher als bei Daten mit nur einem Versuch pro Zeile. Die Werte des R2 der Abweichung sind nur bei Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.
Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.
Verwenden Sie das korrigierte R2 der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Termen enthalten. Das R2 der Abweichung nimmt beim Einbinden eines Terms in ein Modell stets zu. Das korrigierte R2 der Abweichung berücksichtigt die Anzahl der Terme im Modell, was die Auswahl des richtigen Modells erleichtert.
Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.
R-Qd der Abweichung | R-Qd(kor) der Abweichung | AIC | AICc | BIC |
---|---|---|---|---|
97,95% | 76,75% | 105,98 | 171,98 | 114,48 |
In diesen Ergebnissen erklärt das Modell 97,95 % der Gesamtabweichung in der Antwortvariablen. Für diese Daten gibt das R2 der Abweichung an, dass das Modell gut an die Daten angepasst ist. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R2 der Abweichung sowie das AIC, das AICc und das BIC, um zu vergleichen, wie gut die Modelle an die Daten angepasst sind.
Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.
Variable | Wert | Anzahl | Ereignisbezeichnung |
---|---|---|---|
Verderben | Ereignis | 506 | Event |
Nicht-Ereignis | 7482 | ||
Gebinde | Gesamt | 7988 |
Test | DF | Chi-Quadrat | p-Wert |
---|---|---|---|
Abweichung | 5 | 0,97 | 0,965 |
Pearson | 5 | 0,97 | 0,965 |
Hosmer-Lemeshow | 6 | 0,10 | 1,000 |
In diesen Ergebnisse weisen alle Tests auf Güte der Anpassung p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.