Interpretieren der wichtigsten Ergebnisse für Binäre Antwort für faktoriellen Versuchsplan analysieren

Führen Sie die folgenden Schritte aus, um einen faktoriellen Versuchsplan zu analysieren. Zu den wichtigsten Ausgaben zählen das Pareto-Diagramm, die p-Werte, die Koeffizienten, die Statistiken zur Zusammenfassung des Modells und die Residuendiagramme.

Schritt 1: Ermitteln, welche Terme den größten Effekt auf die Antwortvariable haben

Verwenden Sie ein Pareto-Diagramm der standardisierten Effekte, um die relative Größe und die statistische Signifikanz von Haupteffekten und Wechselwirkungseffekten zu vergleichen.

Minitab stellt die standardisierten Effekte in absteigender Reihenfolge ihrer Absolutwerte dar. Die Referenzlinie im Diagramm zeigt, welche Effekte signifikant sind. In der Standardeinstellung zeichnet Minitab die Referenzlinie bei einem Signifikanzniveau von 0,05.

Wichtigste Ergebnisse: Pareto-Diagramm

In diesen Ergebnissen sind die drei Haupteffekte statistisch signifikant (α = 0,05) – Art des Konservierungsmittels (A), Vakuumversiegelungsdruck (B) und Grad der Verunreinigung (C).

Darüber hinaus können Sie feststellen, dass die Art des Konservierungsmittels (A) den größten Effekt hat, da er sich am weitesten erstreckt. Der Effekt der Wechselwirkung zwischen Konservierungsmittel und Kühltemperatur (AD) ist am geringsten, da er sich am kürzesten erstreckt.

Schritt 2: Bestimmen, welche Terme statistisch signifikante Effekte auf die Antwortvariable haben

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist, was bedeutet, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein Koeffizient für einen Faktor signifikant ist, können Sie schlussfolgern, dass die Wahrscheinlichkeit des Ereignisses nicht für alle Stufen des Faktors gleich ist.
  • Wenn ein Koeffizient für eine Kovariate signifikant ist, besteht eine Assoziation zwischen Änderungen des Werts der Variablen und Änderungen der Wahrscheinlichkeit.
  • Wenn ein Koeffizient für einen Wechselwirkungsterm signifikant ist, hängt die Beziehung zwischen einem Faktor und der Antwortvariablen von den anderen Faktoren im Term ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen.
  • Wenn der Koeffizient für einen Block statistisch signifikant ist, können Sie schlussfolgern, dass sich die Linkfunktion für den Block vom Durchschnittswert unterscheidet.

Kodierte Koeffizienten

TermEffektKoefSE KoefVIF
Konstante  -2,73700,0479 
Konservierungsmittel0,44970,22490,04771,03
Vakuumdruck0,25740,12870,04771,06
Verunreinigungsgrad0,29540,14770,04781,06
KühlTemp-0,1107-0,05540,04781,07
Konservierungsmittel*Vakuumdruck-0,0233-0,01170,04731,05
Konservierungsmittel*Verunreinigungsgrad0,07220,03610,04741,06
Konservierungsmittel*KühlTemp0,00670,00340,04721,05
Vakuumdruck*Verunreinigungsgrad-0,0430-0,02150,04691,04
Vakuumdruck*KühlTemp-0,0115-0,00580,04651,02
Verunreinigungsgrad*KühlTemp0,15730,07860,04671,02
Wichtigstes Ergebnis: Koeffizienten

In diesen Ergebnissen sind die Koeffizienten für die Haupteffekte von Konservierungsmittel, Vakuumdruck und Verunreinigungsgrad positive Zahlen. Der Koeffizient des Haupteffekts von KühlTemp ist eine negative Zahl. Im Allgemeinen gilt bei einem zunehmenden Wert des Terms: Positive Koeffizienten steigern die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern.

Varianzanalyse

QuelleDFKor AbwKor MWChi-Quadratp-Wert
Modell1046,21304,621346,210,000
  Konservierungsmittel122,683522,683522,680,000
  Vakuumdruck17,33137,33137,330,007
  Verunreinigungsgrad19,62099,62099,620,002
  KühlTemp11,34411,34411,340,246
  Konservierungsmittel*Vakuumdruck10,06080,06080,060,805
  Konservierungsmittel*Verunreinigungsgrad10,57800,57800,580,447
  Konservierungsmittel*KühlTemp10,00510,00510,010,943
  Vakuumdruck*Verunreinigungsgrad10,21060,21060,210,646
  Vakuumdruck*KühlTemp10,01530,01530,020,902
  Verunreinigungsgrad*KühlTemp12,84752,84752,850,092
Fehler50,96740,1935   
Gesamt1547,1804     
Wichtigstes Ergebnis: p-Wert

In diesen Ergebnissen sind die Haupteffekte für Konservierungsmittel, Vakuumdruck und Verunreinigungsgrad bei einem Signifikanzniveau von 0,05 statistisch signifikant. Sie können schlussfolgern, dass zwischen Änderungen dieser Variablen und Änderungen der Antwortvariablen eine Assoziation besteht.

Die Wechselwirkungsterme sind statistisch nicht signifikant. Die Beziehung zwischen den einzelnen Variablen und der Antwortvariablen hängen möglicherweise nicht vom Wert der jeweils anderen Variablen ab.

Schritt 3: Verstehen der Effekte der Prädiktoren

Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen stetigen oder einen kategorialen Prädiktor handelt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.
Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.

Chancenverhältnisse für stetige Prädiktoren

ÄnderungseinheitChancenverhältnis95%-KI
Dosis (mg)0,56,1279(1,7218; 21,8087)
Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. In diesem Beispiel stellt das Nichtvorhandensein von Bakterien das Ereignis dar. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.

Chancenverhältnisse für kategoriale Prädiktoren

Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis auf Stufe A wahrscheinlicher ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis auf Stufe A weniger wahrscheinlich ist. Weitere Informationen zur Kodierung von kategorialen Prädiktoren finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.

Chancenverhältnisse für kategoriale Prädiktoren

Stufe AStufe BChancenverhältnis95%-KI
Monat     
  211,1250(0,0600; 21,0834)
  313,3750(0,2897; 39,3165)
  417,7143(0,7461; 79,7592)
  512,2500(0,1107; 45,7172)
  616,0000(0,5322; 67,6397)
  323,0000(0,2547; 35,3325)
  426,8571(0,6556; 71,7169)
  522,0000(0,0976; 41,0019)
  625,3333(0,4679; 60,7946)
  432,2857(0,4103; 12,7323)
  530,6667(0,0514; 8,6389)
  631,7778(0,2842; 11,1200)
  540,2917(0,0252; 3,3719)
  640,7778(0,1464; 4,1326)
  652,6667(0,2124; 33,4861)
Chancenverhältnis für Stufe A relativ zu Stufe B
Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen ist der kategoriale Prädiktor der Monat ab dem Beginn der Hochsaison eines Hotels. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. In diesem Beispiel stellt die Stornierung das Ereignis dar. Das größte Chancenverhältnis beträgt etwa 7,71, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.

Schritt 4: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.
Hinweis

Viele Statistiken zur Übersicht des Modells und zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der Hosmer-Lemeshow-Test wird durch die Anordnung der Daten nicht beeinflusst und liefert bei einem Versuch pro Zeile ähnliche Ergebnisse wie bei mehreren Versuchen pro Zeile. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

R-Qd der Abweichung

Je höher das R2 der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R2 der Abweichung liegt immer zwischen 0 % und 100 %.

Das R2 der Abweichung nimmt beim Einbinden zusätzlicher Terme in ein Modell stets zu. Das beste Modell mit fünf Termen weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Termen ist. Daher ist das R2 der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

Die Anordnung der Daten beeinflusst den Wert des R2 der Abweichung. Das R2 der Abweichung ist bei Daten mit mehreren Versuchen pro Zeile in der Regel höher als bei Daten mit nur einem Versuch pro Zeile. Die Werte des R2 der Abweichung sind nur bei Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.

Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

R-Qd(kor) der Abweichung

Verwenden Sie das korrigierte R2 der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Termen enthalten. Das R2 der Abweichung nimmt beim Einbinden eines Terms in ein Modell stets zu. Das korrigierte R2 der Abweichung berücksichtigt die Anzahl der Terme im Modell, was die Auswahl des richtigen Modells erleichtert.

AIC, AICc und BIC

Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Zusammenfassung des Modells

R-Qd der
Abweichung
R-Qd(kor)
der
Abweichung
AICAICcBIC
97,95%76,75%105,98171,98114,48
Wichtigste Ergebnisse: R-Qd der Abweichung, R-Qd(kor) der Abweichung, AIC

In diesen Ergebnissen erklärt das Modell 97,95 % der Gesamtabweichung in der Antwortvariablen. Für diese Daten gibt das R2 der Abweichung an, dass das Modell gut an die Daten angepasst ist. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R2 der Abweichung sowie das AIC, das AICc und das BIC, um zu vergleichen, wie gut die Modelle an die Daten angepasst sind.

Schritt 5: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Mit den folgenden Statistiken wird die Güte der Anpassung getestet. Die Abweichungsstatistik und die Pearson-Statistik werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält.
  • Abweichung: Der p-Wert für den Abweichungstest ist für Daten mit einem Versuch pro Zeile tendenziell kleiner als für Daten mit mehreren Versuchen pro Zeile und nimmt generell mit der Anzahl der Versuche pro Zeile ab. Für Daten mit einem Versuch pro Zeile sind die Ergebnisse des Hosmer-Lemeshow-Tests zuverlässiger.
  • Pearson: Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im Format mit einem Versuch pro Zeile vorliegen.
  • Hosmer-Lemeshow: Der Hosmer-Lemeshow-Test hängt nicht wie die anderen Tests auf Güte der Anpassung von der Anzahl der Versuche pro Zeile in den Daten ab.Wenn die Daten nur wenige Versuche pro Zeile aufweisen, ist der Hosmer-Lemeshow-Test ein zuverlässigerer Indikator dafür, wie gut das Modell an die Daten angepasst ist.

Informationen zur Antwortvariablen

VariableWertAnzahlEreignisbezeichnung
VerderbenEreignis506Event
  Nicht-Ereignis7482 
GebindeGesamt7988 

Tests auf Güte der Anpassung

TestDFChi-Quadratp-Wert
Abweichung50,970,965
Pearson50,970,965
Hosmer-Lemeshow60,101,000
Wichtigste Ergebnisse für das Ereignis-/Versuchsformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnisse weisen alle Tests auf Güte der Anpassung p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.