Die Gesamt-Freiheitsgrade (DF) entsprechen der Menge an Informationen in Ihren Daten. In der Analyse werden diese Informationen verwendet, um die Werte von unbekannten Parametern der Grundgesamtheit zu schätzen. Die Gesamt-Freiheitsgrade werden durch die Anzahl der Beobachtungen in der Stichprobe bestimmt. Die DF für einen Term geben an, wie viele Informationen von dem betreffenden Term genutzt werden. Wenn Sie die Stichprobe vergrößern, stehen Ihnen mehr Informationen über die Grundgesamtheit und somit auch mehr Gesamt-Freiheitsgrade zur Verfügung. Durch Vergrößern der Anzahl von Termen im Modell werden mehr Informationen genutzt, wodurch die verfügbaren DF zum Schätzen der Streuung der Parameterschätzwerte abnehmen.
Wenn zwei Bedingungen erfüllt sind, unterteilt Minitab die DF für Fehler. Die erste Bedingung ist, dass Terme vorhanden sein müssen, die auf die Daten passen, jedoch im aktuellen Modell nicht enthalten sind. Wenn Sie beispielsweise über einen stetigen Prädiktor mit mindestens drei eindeutigen Werten verfügen, können Sie für diesen einen quadratischen Term schätzen. Wenn das Modell den quadratischen Term nicht enthält, liegt kein Term im Modell vor, der auf die Daten passt, und diese Bedingung ist erfüllt.
Die zweite Bedingung ist, dass die Daten Replikationen enthalten. Replikationen sind Beobachtungen, bei denen jeder Prädiktor den gleichen Wert aufweist. Wenn beispielsweise drei Beobachtungen vorliegen, bei denen der Druck gleich 5 und die Temperatur gleich 25 ist, stellen diese drei Beobachtungen Replikationen dar.
Wenn die beiden Bedingungen erfüllt sind, setzt sich DF für Fehler aus den Komponenten für fehlende Anpassung und reine Fehler zusammen. DF für fehlende Anpassung ermöglicht einen Test, bei dem geprüft wird, ob die Form des Modells angemessen ist. Beim Test auf fehlende Anpassung werden die Freiheitsgrade für fehlende Anpassung verwendet. Je größer der Wert für DF reine Fehler, desto größer ist die Trennschärfe des Tests auf fehlende Anpassung.
Die korrigierte Summe der Quadrate ist ein Maß für die Streuung verschiedener Teile des Modells. Die Reihenfolge der Prädiktoren im Modell wirkt sich nicht auf die Berechnung der korrigierten Summe der Quadrate aus. In der Tabelle der Varianzanalyse verteilt Minitab die Summe der Quadrate auf verschiedene Komponenten, die die auf unterschiedliche Quellen zurückzuführende Streuung beschreiben.
Minitab verwendet die korrigierten Summen der Quadrate, um die p-Werte in der ANOVA-Tabelle zu berechnen. Zudem verwendet Minitab die Summen der Quadrate, um das R2 zu berechnen. Im Allgemeinen interpretieren Sie die p-Werte sowie das R2 und nicht die Summen der Quadrate.
Mit dem korrigierten Mittel der Quadrate wird angegeben, wie viel der Streuung von einem Term oder einem Modell erklärt wird; hierbei wird angenommen, dass alle übrigen Terme im Modell enthalten sind, jedoch wird ihre Reihenfolge im Modell außer Acht gelassen. Im Unterschied zur korrigierten Summe der Quadrate werden beim korrigierten Mittel der Quadrate die Freiheitsgrade berücksichtigt.
Der korrigierte mittlere quadrierte Fehler (auch als MSE oder s2 bezeichnet) ist die Varianz um die angepassten Werte.
Minitab verwendet die korrigierten Mittel der Quadrate, um die p-Werte in der ANOVA-Tabelle zu berechnen. Außerdem verwendet Minitab das korrigierte Mittel der Quadrate, um das korrigierte R2 zu berechnen. Im Allgemeinen interpretieren Sie die p-Werte und das korrigierte R2 und nicht das korrigierte Mittel der Quadrate.
Die sequenzielle Summe der Quadrate ist ein Maß für die Streuung verschiedener Teile des Modells. Im Unterschied zur korrigierten Summe der Quadrate hängt die sequenzielle Summe der Quadrate von der Reihenfolge ab, in der die Terme in das Modell aufgenommen wurden.
Minitab verwendet die sequenziellen Summen der Quadrate beim Analysieren eines Versuchsplans nicht, um p-Werte zu berechnen, Sie können die sequenziellen Summen der Quadrate jedoch beim Ausführen der Befehle Regressionsmodell anpassen und Allgemeines lineares Modell anpassen verwenden. Im Allgemeinen interpretieren Sie die p-Werte und das R2 auf der Grundlage der korrigierten Summen der Quadrate.
Mit dem Beitrag wird der prozentuale Anteil dargestellt, den die einzelnen Quellen zur Gesamtstreuung der Antwortvariablen beitragen.
Höhere Prozentsätze geben an, dass die Quelle einen größeren Anteil zur Streuung der Antwortvariablen beiträgt. Der prozentuale Beitrag für das Wirkungsflächenmodell entspricht dem R2.
Für jeden Test in der Tabelle der Varianzanalyse wird ein F-Wert angezeigt.
Minitab verwendet den F-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz des Tests treffen können. Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft. Ein hinreichend großer F-Wert gibt eine statistische Signifikanz an.
Wenn Sie mit dem F-Wert feststellen möchten, ob die Nullhypothese zurückzuweisen ist, vergleichen Sie den F-Wert mit dem kritischen Wert. Sie können den kritischen Wert in Minitab berechnen oder diesen einer in den meisten Fachbüchern vorhandenen Tabelle für die F-Verteilung entnehmen. Weitere Informationen zum Berechnen des kritischen Werts mit Hilfe von Minitab finden Sie unter Verwenden der inversen kumulativen Verteilungsfunktion (ICDF); klicken Sie dort auf „Verwenden der ICDF zum Berechnen von kritischen Werten“.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Um zu bestimmen, ob das Modell die Streuung in der Antwortvariablen erklärt, vergleichen Sie den p-Wert für das Modell mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese für das Modell besagt, dass das Modell die Streuung in der Antwortvariablen nicht erklärt. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass das Modell die Streuung in der Antwortvariablen erklärt, während dies tatsächlich nicht der Fall ist, von 5 %.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Blöcke erklären die Differenzen, die zwischen Durchläufen auftreten können, die unter unterschiedlichen Bedingungen ausgeführt werden. Ein Techniker entwickelt beispielsweise einen Versuchsplan, in dem ein Schweißprozess untersucht wird, und dabei kann er nicht alle Daten am gleichen Tag erfassen. Die Schweißqualität wird durch verschiedene Variablen beeinflusst, die sich von Tag zu Tag ändern und außerhalb der Kontrolle des Technikers liegen, z. B. durch die relative Luftfeuchtigkeit. Um diese nicht kontrollierbaren Variablen zu berücksichtigen, gruppiert der Techniker die täglich ausgeführten Durchläufe in separaten Blöcken. Die Blöcke erklären die Streuung durch die nicht kontrollierbaren Variablen, so dass diese Effekte nicht mit den Effekten der Faktoren verwechselt werden, die untersucht werden sollen. Weitere Informationen dazu, wie Minitab Durchläufe zu Blöcken zuordnet, finden Sie unter Was ist ein Block?.
Um zu bestimmen, ob die Antwortvariable durch unterschiedliche Bedingungen zwischen den Durchläufen geändert wird, vergleichen Sie den p-Wert für die Blöcke mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass die Antwortvariable durch unterschiedliche Bedingungen nicht geändert wird.
In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko von 5 % für die Schlussfolgerung an, dass sich die Antwortvariable durch unterschiedliche Bedingungen bei den einzelnen Durchläufen ändert, während dies tatsächlich nicht der Fall ist.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Wenn eine Gruppe von Termen statistisch signifikant ist, können Sie schlussfolgern, dass mindestens einer der Terme in der Gruppe einen Effekt auf die Antwortvariable hat. Wenn Sie anhand der statistischen Signifikanz entscheiden, welche Terme im Modell beibehalten werden sollen, entfernen Sie in der Regel keine ganzen Gruppen von Termen gleichzeitig. Die statistische Signifikanz einzelner Terme kann sich aufgrund der im Modell enthaltenen Terme ändern.
Quelle | DF | Kor SS | Kor MS | F-Wert | p-Wert |
---|---|---|---|---|---|
Modell | 10 | 447,766 | 44,777 | 17,61 | 0,003 |
Linear | 4 | 428,937 | 107,234 | 42,18 | 0,000 |
Material | 1 | 181,151 | 181,151 | 71,25 | 0,000 |
EinsprDruck | 1 | 112,648 | 112,648 | 44,31 | 0,001 |
EinsprTemp | 1 | 73,725 | 73,725 | 29,00 | 0,003 |
AbkühlTemp | 1 | 61,412 | 61,412 | 24,15 | 0,004 |
2-Faktor-Wechselwirkungen | 6 | 18,828 | 3,138 | 1,23 | 0,418 |
Material*EinsprDruck | 1 | 0,342 | 0,342 | 0,13 | 0,729 |
Material*EinsprTemp | 1 | 0,778 | 0,778 | 0,31 | 0,604 |
Material*AbkühlTemp | 1 | 4,565 | 4,565 | 1,80 | 0,238 |
EinsprDruck*EinsprTemp | 1 | 0,002 | 0,002 | 0,00 | 0,978 |
EinsprDruck*AbkühlTemp | 1 | 0,039 | 0,039 | 0,02 | 0,906 |
EinsprTemp*AbkühlTemp | 1 | 13,101 | 13,101 | 5,15 | 0,072 |
Fehler | 5 | 12,712 | 2,542 | ||
Gesamt | 15 | 460,478 |
In diesem Modell ist der Test auf Zwei-Faktor-Wechselwirkungen auf einem Niveau von 0,05 statistisch nicht signifikant.
Quelle | DF | Kor SS | Kor MS | F-Wert | p-Wert |
---|---|---|---|---|---|
Modell | 5 | 442,04 | 88,408 | 47,95 | 0,000 |
Linear | 4 | 428,94 | 107,234 | 58,16 | 0,000 |
Material | 1 | 181,15 | 181,151 | 98,24 | 0,000 |
EinsprDruck | 1 | 112,65 | 112,648 | 61,09 | 0,000 |
EinsprTemp | 1 | 73,73 | 73,725 | 39,98 | 0,000 |
AbkühlTemp | 1 | 61,41 | 61,412 | 33,31 | 0,000 |
2-Faktor-Wechselwirkungen | 1 | 13,10 | 13,101 | 7,11 | 0,024 |
EinsprTemp*AbkühlTemp | 1 | 13,10 | 13,101 | 7,11 | 0,024 |
Fehler | 10 | 18,44 | 1,844 | ||
Gesamt | 15 | 460,48 |
Wenn Sie das Modell ausgehend von der Zwei-Faktor-Wechselwirkung mit dem höchsten p-Wert jeweils um einen einzelnen Term reduzieren, ist die letzte Zwei-Faktor-Wechselwirkung auf dem Niveau 0,05 statistisch signifikant.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Wenn der p-Wert größer als das Signifikanzniveau ist, wird mit dem Test keine fehlende Anpassung erkannt.