Interpretieren der wichtigsten Ergebnisse für Binäre Antwort für Wirkungsflächenversuchsplan analysieren

Führen Sie die folgenden Schritte aus, um einen faktoriellen Versuchsplan zu interpretieren. Zu den wichtigsten Ausgaben zählen die p-Werte, die Koeffizienten, R² und die Residuendiagramme.

In diesem Thema

Schritt 1: Ermitteln, welche Terme den größten Effekt auf die Antwortvariable haben
Schritt 2: Bestimmen, welche Terme statistisch signifikante Effekte auf die Antwortvariable haben
Schritt 3: Verstehen der Effekte der Prädiktoren
Schritt 4: Bestimmen, wie gut das Modell an die Daten angepasst ist
Schritt 5: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Schritt 1: Ermitteln, welche Terme den größten Effekt auf die Antwortvariable haben

Verwenden Sie ein Pareto-Diagramm der standardisierten Effekte, um die relative Größe und die statistische Signifikanz von Haupteffekten, quadratischen Effekten und Wechselwirkungseffekten zu vergleichen.

Minitab stellt die standardisierten Effekte in absteigender Reihenfolge ihrer Absolutwerte dar. Die Referenzlinie im Diagramm zeigt, welche Effekte signifikant sind. In der Standardeinstellung zeichnet Minitab die Referenzlinie bei einem Signifikanzniveau von 0,05.

Wichtigste Ergebnisse: Pareto-Diagramm
In diesen Ergebnissen sind der quadrierte Term für Temperatur (BB) und die Haupteffekte für Temperatur (B) und Druck (C) beim Signifikanzniveau α = 0,05 signifikant.
Darüber hinaus können Sie feststellen, dass der größte Effekt Temperatur*Temperatur (BB) ist, da er sich am weitesten erstreckt. Druck*Druck (CC) ist der kleinste Effekt, da er sich am kürzesten erstreckt.

Schritt 2: Bestimmen, welche Terme statistisch signifikante Effekte auf die Antwortvariable haben

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist, was bedeutet, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.

p-Wert ≤ α: Die Assoziation ist statistisch signifikant: Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant: Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.; Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.

Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:

Wenn ein Koeffizient für einen Faktor signifikant ist, können Sie schlussfolgern, dass die Wahrscheinlichkeit des Ereignisses nicht für alle Stufen des Faktors gleich ist.
Wenn ein Koeffizient für einen quadrierten Term signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen dem Faktor und der Antwortvariablen einer gekrümmten Linie folgt.
Wenn ein Koeffizient für einen Wechselwirkungsterm signifikant ist, hängt die Beziehung zwischen einem Faktor und der Antwortvariablen von den anderen Faktoren im Term ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen.
Wenn der Koeffizient für einen Block statistisch signifikant ist, können Sie schlussfolgern, dass sich die Linkfunktion für den Block vom Durchschnittswert unterscheidet.

Kodierte Koeffizienten

Term	Koef	SE Koef	VIF
Konstante	3,021	0,384
Zeit	0,210	0,139	18,53
Temperatur	0,641	0,159	19,53
Druck	0,420	0,211	70,48
Zeit*Zeit	-0,0735	0,0482	1,01
Temperatur*Temperatur	0,2988	0,0517	1,17
Druck*Druck	-0,0022	0,0277	70,24
Zeit*Temperatur	-0,0092	0,0505	1,14
Zeit*Druck	0,0417	0,0342	18,12
Temperatur*Druck	-0,0521	0,0396	19,24

Wichtigste Ergebnisse: Koeffizienten

In diesen Ergebnissen sind die Koeffizienten für die Haupteffekte von Zeit, Temperatur und Druck positive Zahlen. Der Koeffizient für den quadrierten Term Zeit*Zeit ist eine negative Zahl. Im Allgemeinen gilt bei einem zunehmenden Wert des Terms: Positive Koeffizienten steigern die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern.

Varianzanalyse

Quelle	DF	Kor Abw	Kor MW	Chi-Quadrat	p-Wert
Modell	9	903,478	100,386	903,48	0,000
Zeit	1	2,303	2,303	2,30	0,129
Temperatur	1	16,388	16,388	16,39	0,000
Druck	1	3,966	3,966	3,97	0,046
Zeit*Zeit	1	2,331	2,331	2,33	0,127
Temperatur*Temperatur	1	34,012	34,012	34,01	0,000
Druck*Druck	1	0,006	0,006	0,01	0,937
Zeit*Temperatur	1	0,033	0,033	0,03	0,856
Zeit*Druck	1	1,490	1,490	1,49	0,222
Temperatur*Druck	1	1,731	1,731	1,73	0,188
Fehler	5	23,404	4,681
Gesamt	14	926,882

Wichtigste Ergebnisse: p-Wert

In diesen Ergebnissen sind der quadrierte Term Temperatur*Temperatur und die Haupteffekte für Temperatur und Druck beim Signifikanzniveau α = 0,05 signifikant.

Schritt 3: Verstehen der Effekte der Prädiktoren

Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen stetigen oder einen kategorialen Prädiktor handelt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.

Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.

Chancenverhältnisse für stetige Prädiktoren

	Änderungseinheit	Chancenverhältnis	95%-KI
Dosis (mg)	0,5	6,1279	(1,7218; 21,8087)

Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. In diesem Beispiel stellt das Nichtvorhandensein von Bakterien das Ereignis dar. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.

Chancenverhältnisse für kategoriale Prädiktoren

Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. In Minitab wird der Vergleich durch Auflisten der Stufen in zwei Spalten eingerichtet: Stufe A und Stufe B. Stufe B stellt die Referenzstufe für den Faktor dar. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis auf Stufe A wahrscheinlicher ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis auf Stufe A weniger wahrscheinlich ist. Weitere Informationen zur Kodierung von kategorialen Prädiktoren finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.

Chancenverhältnisse für kategoriale Prädiktoren

Stufe A	Stufe B	Chancenverhältnis	95%-KI
Monat
2	1	1,1250	(0,0600; 21,0834)
3	1	3,3750	(0,2897; 39,3165)
4	1	7,7143	(0,7461; 79,7592)
5	1	2,2500	(0,1107; 45,7172)
6	1	6,0000	(0,5322; 67,6397)
3	2	3,0000	(0,2547; 35,3325)
4	2	6,8571	(0,6556; 71,7169)
5	2	2,0000	(0,0976; 41,0019)
6	2	5,3333	(0,4679; 60,7946)
4	3	2,2857	(0,4103; 12,7323)
5	3	0,6667	(0,0514; 8,6389)
6	3	1,7778	(0,2842; 11,1200)
5	4	0,2917	(0,0252; 3,3719)
6	4	0,7778	(0,1464; 4,1326)
6	5	2,6667	(0,2124; 33,4861)

Wichtigstes Ergebnis: Chancenverhältnis

In diesen Ergebnissen ist der kategoriale Prädiktor der Monat ab dem Beginn der Hochsaison eines Hotels. Die Antwortvariable gibt an, ob ein Gast eine Reservierung storniert oder nicht. In diesem Beispiel stellt die Stornierung das Ereignis dar. Das größte Chancenverhältnis beträgt etwa 7,71, wenn Stufe A gleich Monat 4 und Stufe B gleich Monat 1 ist. Das bedeutet, dass die Chance, dass ein Gast seine Reservierung storniert, in Monat 4 annähernd 8 Mal größer als in Monat 1 ist.

Schritt 4: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.

Hinweis

Viele Statistiken zur Übersicht des Modells und zur Güte der Anpassung werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält. Der Hosmer-Lemeshow-Test wird durch die Anordnung der Daten nicht beeinflusst und liefert bei einem Versuch pro Zeile ähnliche Ergebnisse wie bei mehreren Versuchen pro Zeile. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

R-Qd der Abweichung

Je höher das R² der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R² der Abweichung liegt immer zwischen 0 % und 100 %.

Das R² der Abweichung nimmt beim Einbinden zusätzlicher Terme in ein Modell stets zu. Das beste Modell mit fünf Termen weist beispielsweise immer ein R² auf, das mindestens so hoch wie das des besten Modells mit vier Termen ist. Daher ist das R² der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

Die Anordnung der Daten beeinflusst den Wert des R² der Abweichung. Das R² der Abweichung ist bei Daten mit mehreren Versuchen pro Zeile in der Regel höher als bei Daten mit nur einem Versuch pro Zeile. Die Werte des R² der Abweichung sind nur bei Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird.

Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

R-Qd(kor) der Abweichung

Verwenden Sie das korrigierte R² der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Termen enthalten. Das R² der Abweichung nimmt beim Einbinden eines Terms in ein Modell stets zu. Das korrigierte R² der Abweichung berücksichtigt die Anzahl der Terme im Modell, was die Auswahl des richtigen Modells erleichtert.

AIC, AICc und BIC

Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Zusammenfassung des Modells

R-Qd der Abweichung	R-Qd(kor) der Abweichung	AIC	AICc	BIC
97,95%	76,75%	105,98	171,98	114,48

Wichtigste Ergebnisse: R-Qd der Abweichung, R-Qd(kor) der Abweichung, AIC

In diesen Ergebnissen erklärt das Modell 97,95 % der Gesamtabweichung in der Antwortvariablen. Für diese Daten gibt das R² der Abweichung an, dass das Modell gut an die Daten angepasst ist. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie das korrigierte R² der Abweichung sowie das AIC, das AICc und das BIC, um zu vergleichen, wie gut die Modelle an die Daten angepasst sind.

Schritt 5: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die die Binomialverteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die die Binomialverteilung nicht prognostiziert. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:

Falsche Linkfunktion
Fehlender Term höherer Ordnung für Variablen im Modell
Fehlender Prädiktor, der nicht im Modell enthalten ist
Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Mit den folgenden Statistiken wird die Güte der Anpassung getestet. Die Abweichungsstatistik und die Pearson-Statistik werden davon beeinflusst, wie die Daten im Arbeitsblatt angeordnet sind und ob jede Zeile einen oder mehrere Versuche enthält.

Abweichung: Der p-Wert für den Abweichungstest ist für Daten mit einem Versuch pro Zeile tendenziell kleiner als für Daten mit mehreren Versuchen pro Zeile und nimmt generell mit der Anzahl der Versuche pro Zeile ab. Für Daten mit einem Versuch pro Zeile sind die Ergebnisse des Hosmer-Lemeshow-Tests zuverlässiger.
Pearson: Die vom Pearson-Test verwendete Approximation an die Chi-Quadrat-Verteilung ist ungenau, wenn die erwartete Anzahl von Ereignissen pro Zeile in den Daten klein ist. Daher ist der Test auf Güte der Anpassung nach Pearson ungenau, wenn die Daten im Format mit einem Versuch pro Zeile vorliegen.
Hosmer-Lemeshow: Der Hosmer-Lemeshow-Test hängt nicht wie die anderen Tests auf Güte der Anpassung von der Anzahl der Versuche pro Zeile in den Daten ab.Wenn die Daten nur wenige Versuche pro Zeile aufweisen, ist der Hosmer-Lemeshow-Test ein zuverlässigerer Indikator dafür, wie gut das Modell an die Daten angepasst ist.

Informationen zur Antwortvariablen

Variable	Wert	Anzahl	Ereignisbezeichnung
Verderben	Ereignis	506	Event
	Nicht-Ereignis	7482
Gebinde	Gesamt	7988

Tests auf Güte der Anpassung

Test	DF	Chi-Quadrat	p-Wert
Abweichung	5	0,97	0,965
Pearson	5	0,97	0,965
Hosmer-Lemeshow	6	0,10	1,000

Wichtigste Ergebnisse für das Ereignis-/Versuchsformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test

In diesen Ergebnisse weisen alle Tests auf Güte der Anpassung p-Werte auf, die über dem üblichen Signifikanzniveau 0,05 liegen. Die Tests liefern keine Anzeichen dafür, dass die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die mit der Binomialverteilung nicht prognostiziert wird.

Interpretieren der wichtigsten Ergebnisse für Binäre Antwort für Wirkungsflächenversuchsplan analysieren

In diesem Thema

Schritt 1: Ermitteln, welche Terme den größten Effekt auf die Antwortvariable haben

Wichtigste Ergebnisse: Pareto-Diagramm

Schritt 2: Bestimmen, welche Terme statistisch signifikante Effekte auf die Antwortvariable haben

Kodierte Koeffizienten

Wichtigste Ergebnisse: Koeffizienten

Varianzanalyse

Wichtigste Ergebnisse: p-Wert

Schritt 3: Verstehen der Effekte der Prädiktoren

Chancenverhältnisse für stetige Prädiktoren

Wichtigstes Ergebnis: Chancenverhältnis

Chancenverhältnisse für kategoriale Prädiktoren

Wichtigstes Ergebnis: Chancenverhältnis

Schritt 4: Bestimmen, wie gut das Modell an die Daten angepasst ist

Hinweis

Zusammenfassung des Modells

Wichtigste Ergebnisse: R-Qd der Abweichung, R-Qd(kor) der Abweichung, AIC

Schritt 5: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Informationen zur Antwortvariablen

Tests auf Güte der Anpassung

Wichtigste Ergebnisse für das Ereignis-/Versuchsformat: Informationen zur Antwortvariablen, Abweichungstest, Pearson-Test, Hosmer-Lemeshow-Test