Interpretieren der wichtigsten Ergebnisse für Mischungsversuchsplan analysieren

Führen Sie die folgenden Schritte aus, um einen Mischungsversuchsplan zu analysieren. Zu den wichtigsten Ausgaben zählen die p-Werte, die Koeffizienten, die Statistiken zur Zusammenfassung des Modells und die Residuendiagramme.

In diesem Thema

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist
Schritt 2: Bestimmen, wie gut das Modell an die Daten angepasst ist
Schritt 3: Bestimmen, ob das Modell die Annahmen der Analyse erfüllt

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.

p-Wert ≤ α: Die Assoziation ist statistisch signifikant: Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant: Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, dass Modell ohne den Term erneut anzupassen.; Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.

Minitab zeigt aufgrund der Abhängigkeit zwischen den Komponenten in Mischungsexperimenten keine p-Werte für die linearen Terme der Komponenten an. Da die Komponenten zusammen einen festen Betrag oder einen Gesamtanteil von 1 ergeben müssen, führt eine Änderung an einer Komponente zwingend zu Änderungen an den anderen Komponenten. Außerdem enthält das Modell für ein Mischungsexperiment keine Konstante, da diese in den linearen Termen enthalten ist.

Wenn ein Wechselwirkungsterm statistisch signifikant ist, hängt die Interpretation von der Art der an der Wechselwirkung beteiligten Terme ab. Die Interpretationen lauten wie folgt:

Wechselwirkungsterme, die nur Komponenten enthalten, weisen darauf hin, dass die Assoziation zwischen der Mischung der Komponenten und der Antwortvariablen statistisch signifikant ist.
- Positive Koeffizienten für Wechselwirkungsterme weisen darauf hin, dass sich die Komponenten im Term synergetisch verhalten. Das heißt, dass der Mittelwert der Antwortvariablen größer ist als der Wert, den Sie bei einer Berechnung des einfachen Mittelwerts der Antwortvariablen für die einzelnen reinen Mischungen erhalten würden.
- Negative Koeffizienten für Wechselwirkungsterme weisen darauf hin, dass sich die Komponenten im Term antagonistisch verhalten. Das heißt, dass der Mittelwert der Antwortvariablen kleiner ist als der Wert, den Sie bei einer Berechnung des einfachen Mittelwerts der Antwortvariablen für die einzelnen reinen Mischungen erhalten würden.
Wechselwirkungsterme, die Komponenten und Prozessvariablen enthalten, weisen darauf hin, dass der Effekt der Komponenten auf die Antwortvariable von den Prozessvariablen abhängt.

Tipp

Um die Beziehungen zwischen den Komponenten/Prozessvariablen und der Antwortvariablen näher zu untersuchen, verwenden Sie Konturdiagramm, Wirkungsflächendiagramm und Ergebnisspurendiagramm.

Geschätzte Regressionskoeffizienten für Geschmack (Komponentenanteile)

Term	Koef	SE Koef	t-Wert	p-Wert	VIF
Emmentaler	104,874	0,667	*	*	15,94
Greyerzer	175,08	5,89	*	*	203,46
Brühe	-8,810	0,659	*	*	26,04
Emmentaler*Greyerzer	59,2	10,3	5,75	0,000	57,33
Greyerzer*Brühe	30,04	9,00	3,34	0,008	109,44
Emmentaler*Temperatur	4,500	0,475	9,48	0,000	8,09
Greyerzer*Temperatur	4,500	0,679	6,62	0,000	2,71
Brühe*Temperatur	4,500	0,443	10,16	0,000	11,76

Wichtigste Ergebnisse: p-Wert, Koeffizienten

Alle Wechselwirkungsterme weisen p-Werte auf, die kleiner als das Signifikanzniveau 0,05 sind.

Die positiven Koeffizienten für die Wechselwirkungsterme mit zwei Komponenten weisen darauf hin, dass sich die beiden Komponentenmischungen synergetisch verhalten. Die mittlere Geschmacksbewertung für jede einzelne Mischung ist größer als der Wert, den Sie bei einer Berechnung des einfachen Mittelwerts der beiden Geschmacksbewertungen für die einzelnen reinen Mischungen erhalten würden.

Außerdem weist die Wechselwirkung zwischen den Zutaten und der Prozessvariablen (Temperatur) darauf hin, dass die Geschmacksbewertung der Mischungen von der Serviertemperatur abhängt.

Schritt 2: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.

S

Verwenden Sie S, um zu ermitteln, wie genau das Modell die Antwortvariable beschreibt. Verwenden Sie S anstelle von R², um die Anpassung von Modellen zu vergleichen, die keine Konstante enthalten.

S wird in der Maßeinheit der Antwortvariablen ausgedrückt und stellt den Abstand der Datenwerte von den angepassten Werten dar. Je niedriger der Wert von S, desto genauer beschreibt das Modell die Antwortvariable. Ein niedriger Wert von S allein bedeutet jedoch nicht zwangsläufig, dass das Modell die Modellannahmen erfüllt. Prüfen Sie die Annahmen anhand der Residuendiagramme.

R-Qd

Je höher das R2, desto besser ist das Modell an die Daten angepasst. Das R² liegt immer zwischen 0 % und 100 %.

Der Wert von R² nimmt beim Einbinden zusätzlicher Prädiktoren in das Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R² auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist R² am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

R-Qd(kor)

Verwenden Sie das korrigierte R², wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. R² nimmt stets zu, wenn Sie einen zusätzlichen Prädiktor in das Modell aufnehmen, selbst wenn damit keine tatsächliche Verbesserung des Modells verbunden ist. Der Wert des korrigierten R² berücksichtigt die Anzahl der Prädiktoren im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.

R-Qd(prog)

Verwenden Sie das prognostizierte R2, um zu ermitteln, wie genau das Modell Werte der Antwortvariablen für neue Beobachtungen prognostiziert. Modelle mit einem höheren prognostizierten R² zeichnen sich durch eine bessere Prognosefähigkeit aus.

Ein prognostiziertes R², das wesentlich kleiner als R² ist, kann auf eine übermäßige Anpassung des Modells hinweisen. Ein übermäßig angepasstes Modell liegt vor, wenn Sie Terme für Effekte hinzufügen, die in der Grundgesamtheit unbedeutend sind. Das Modell wird somit an die Stichprobendaten angepasst und ist daher möglicherweise beim Aufstellen von Prognosen für die Grundgesamtheit nicht nützlich.

Das prognostizierte R² kann zudem beim Vergleichen von Modellen nützlicher als das korrigierte R² sein, da der Wert mit Beobachtungen berechnet wird, die in der Modellberechnung nicht enthalten sind.

Untersuchen Sie die folgenden Punkte, wenn Sie die das R² interpretieren:

Kleine Stichproben ermöglichen keinen genauen Schätzwert für die Stärke der Beziehung zwischen der Antwortvariablen und den Prädiktoren. Wenn das R² genauer sein muss, sollten Sie einen größeren Stichprobenumfang (im Allgemeinen 40 oder mehr) wählen.
R² ist nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell ein hohes R² aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.

Zusammenfassung des Modells

S	R-Qd	R-Qd(kor)	PRESS	R-Qd(prog)
0,276960	99,98%	99,97%	2,65322	99,93%

Wichtigste Ergebnisse: S, R-Qd, R-Qd(kor), R-Qd(prog)

In diesen Ergebnissen erklärt das Modell 99,98 % der Streuung in der Geschmacksbewertung. Für diese Daten gibt das R² an, dass das Modell gut an die Daten angepasst ist. Wenn weitere Modelle mit anderen Prädiktoren angepasst werden, verwenden Sie die Werte des korrigierten R² und des prognostizierten R², um die Güte der Anpassung der Modelle an die Daten zu vergleichen.

Schritt 3: Bestimmen, ob das Modell die Annahmen der Analyse erfüllt

Verwenden Sie die Residuendiagramme, um zu ermitteln, ob das Modell angemessen ist und die Annahmen der Analyse erfüllt. Wenn die Annahmen nicht erfüllt werden, ist das Modell u. U. nicht gut an die Daten angepasst, und Sie sollten beim Interpretieren der Ergebnisse vorsichtig sein.

Weitere Informationen zum Umgang mit Mustern in den Residuendiagrammen finden Sie unter Residuendiagramme für Mischungsversuchsplan analysieren; klicken Sie dort auf den Namen des Residuendiagramms in der Liste am oberen Rand der Seite.

Diagramm der Residuen im Vergleich zu den Anpassungen

Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt.

Muster	Mögliche Bedeutung des Musters
Aufgefächerte oder ungleichmäßig gestreute Residuen für die angepassten Werte	Nicht konstante Varianz
Krümmung	Ein fehlender Term höherer Ordnung
Ein weit von null entfernt liegender Punkt	Ein Ausreißer
Ein in x-Richtung weit von den anderen Punkten entfernter Punkt	Ein einflussreicher Punkt

Verwenden Sie das Diagramm der Residuen im Vergleich zu den Anpassungen, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind und eine konstante Varianz aufweisen. Im Idealfall sollten die Punkte zufällig auf beiden Seiten von null verteilt sein, und es sollten keine Muster in den Punkten erkennbar sein.

Diagramm der Residuen im Vergleich zur Reihenfolge

Verwenden Sie das Diagramm der Residuen im Vergleich zur Reihenfolge, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind. Bei in chronologischer Reihenfolge angezeigten unabhängigen Residuen sind weder Trends noch Muster zu erkennen. Muster in den Punkten können darauf hinweisen, dass nahe beieinander liegende Residuen korrelieren und daher nicht unabhängig sind. Im Idealfall sollten die Residuen im Diagramm zufällig um die Mittellinie gestreut sein:

Wenn Sie ein Muster erkennen, untersuchen Sie die Ursache. Die folgenden Typen von Mustern können darauf hinweisen, dass die Residuen abhängig sind.

Wahrscheinlichkeitsnetz (Normal) für Residuen

Verwenden Sie das Wahrscheinlichkeitsnetz (Normal) der Residuen, um die Annahme zu überprüfen, dass die Residuen normalverteilt sind. Die Residuen im Wahrscheinlichkeitsnetz für Normalverteilung sollten ungefähr einer Geraden folgen.