Tabelle der Varianzanalyse für Einfache ANOVA

Hier finden Sie Definitionen und Anleitungen zur Interpretation für jede Statistik in der Tabelle der Varianzanalyse.

In diesem Thema

Welch-Test
DF
DF des Zählers
Freiheitsgrade des Nenners
Seq SS
Beitrag
Kor SS
Kor MS
F-Wert
p-Wert

Welch-Test

Im Unterschied zum Standardverfahren der einfachen ANOVA wird beim Welch-Test nicht angenommen, dass alle Grundgesamtheiten gleiche Varianzen aufweisen. Wenn Minitab den Welch-Test für die einfache ANOVA durchführen soll, deaktivieren Sie die Option Varianz-Gleichheit annehmen im Unterdialogfeld Optionen.

Interpretation

Anleitungen zum Interpretieren der Ergebnisse des Welch-Tests finden Sie unter „p-Wert“.

DF

Die Gesamt-Freiheitsgrade (DF) entsprechen der Menge an Informationen in Ihren Daten. In der Analyse werden diese Informationen verwendet, um die Werte von unbekannten Parametern der Grundgesamtheit zu schätzen. Die Gesamt-Freiheitsgrade werden durch die Anzahl der Beobachtungen in der Stichprobe bestimmt. Die DF für einen Term geben an, wie viele Informationen von dem betreffenden Term genutzt werden. Wenn Sie die Stichprobe vergrößern, stehen Ihnen mehr Informationen über die Grundgesamtheit und somit auch mehr Gesamt-Freiheitsgrade zur Verfügung. Durch Vergrößern der Anzahl von Termen im Modell werden mehr Informationen genutzt, wodurch die verfügbaren DF zum Schätzen der Streuung der Parameterschätzwerte abnehmen.

Wenn zwei Bedingungen erfüllt sind, unterteilt Minitab die DF für Fehler. Die erste Bedingung ist, dass Terme vorhanden sein müssen, die auf die Daten passen, jedoch im aktuellen Modell nicht enthalten sind. Wenn Sie beispielsweise über einen stetigen Prädiktor mit mindestens drei eindeutigen Werten verfügen, können Sie für diesen einen quadratischen Term schätzen. Wenn das Modell den quadratischen Term nicht enthält, liegt kein Term im Modell vor, der auf die Daten passt, und diese Bedingung ist erfüllt.

Die zweite Bedingung ist, dass die Daten Replikationen enthalten. Replikationen sind Beobachtungen, bei denen jeder Prädiktor den gleichen Wert aufweist. Wenn beispielsweise drei Beobachtungen vorliegen, bei denen der Druck gleich 5 und die Temperatur gleich 25 ist, stellen diese drei Beobachtungen Replikationen dar.

Wenn die beiden Bedingungen erfüllt sind, setzt sich DF für Fehler aus den Komponenten für fehlende Anpassung und reine Fehler zusammen. DF für fehlende Anpassung ermöglicht einen Test, bei dem geprüft wird, ob die Form des Modells angemessen ist. Beim Test auf fehlende Anpassung werden die Freiheitsgrade für fehlende Anpassung verwendet. Je größer der Wert für DF reine Fehler, desto größer ist die Trennschärfe des Tests auf fehlende Anpassung.

DF des Zählers

Bei der ANOVA nach Welch verwendet Minitab die Freiheitsgrade für den Zähler, um die Wahrscheinlichkeit zu berechnen, dass ein F-Wert erhalten wird, der mindestens so extrem wie der beobachtete F-Wert ist.

Interpretation

Minitab verwendet den F-Wert, um den p-Wert zu berechnen. Im Allgemeinen sollten Sie den p-Wert untersuchen, da dieser leichter zu interpretieren ist.

Freiheitsgrade des Nenners

Bei der ANOVA nach Welch verwendet Minitab die Freiheitsgrade für den Nenner, um die Wahrscheinlichkeit zu berechnen, dass ein F-Wert erhalten wird, der mindestens so extrem wie der beobachtete F-Wert ist.

Interpretation

Minitab verwendet den F-Wert, um den p-Wert zu berechnen. Im Allgemeinen sollten Sie den p-Wert untersuchen, da dieser leichter zu interpretieren ist.

Seq SS

Die sequenziellen Summen der Quadrate sind Maße für die Streuung verschiedener Komponenten im Modell. Im Unterschied zu den korrigierten Summen der Quadrate hängen die sequenziellen Summen der Quadrate von der Reihenfolge ab, in der die Terme in das Modell aufgenommen wurden. Bei einer einfachen ANOVA entsprechen die sequenziellen Summen der Quadrate immer den korrigierten Summen der Quadrate.

Beitrag

Mit dem Beitrag wird der prozentuale Beitrag jeder Quelle in der Tabelle der Varianzanalyse zur sequenziellen Gesamtsumme der Quadrate (Seq SS) angezeigt.

Interpretation

Höhere Prozentsätze zeigen an, dass die Quelle einen größeren Anteil zur Streuung der Antwortvariablen beiträgt.

Kor SS

Die korrigierten Summen der Quadrate sind Maße für die Streuung verschiedener Komponenten im Modell. Die Reihenfolge der Prädiktoren im Modell wirkt sich nicht auf die Berechnung der korrigierten Summe der Quadrate aus. In der Tabelle der Varianzanalyse verteilt Minitab die Summe der Quadrate auf verschiedene Komponenten, die die auf unterschiedliche Quellen zurückzuführende Streuung beschreiben.

Kor SS Term: Die korrigierte Summe der Quadrate für einen Term ist die Zunahme der Summe der Quadrate für die Regression im Vergleich mit einem Modell, das lediglich die anderen Terme enthält. Dieser Wert ist ein Maß für den Anteil der Streuung in den Daten der Antwortvariablen, der durch die einzelnen Terme im Modell erklärt wird.
Kor SS Fehler: Die Summe der Fehlerquadrate ist die Summe der quadrierten Residuen. Dieser Wert ist ein Maß für die Streuung in den Daten, die durch die Prädiktoren nicht erklärt wird.
Kor SS Gesamt: Die Gesamtsumme der Quadrate ist die Summe der Quadratsummen für die einzelnen Terme und der Summe der Fehlerquadrate. Sie quantifiziert die Gesamtstreuung in den Daten.

Interpretation

Minitab verwendet die korrigierten Summen der Quadrate, um den p-Wert für einen Term zu berechnen. Zudem verwendet Minitab die Summen der Quadrate, um das R² zu berechnen. Im Allgemeinen interpretieren Sie die p-Werte sowie das R² und nicht die Summen der Quadrate.

Kor MS

Mit dem korrigierten Mittel der Quadrate wird angegeben, wie viel der Streuung von einem Term oder einem Modell erklärt wird; hierbei wird angenommen, dass alle übrigen Terme im Modell enthalten sind, jedoch außer Acht gelassen, in welcher Reihenfolge diese in das Modell aufgenommen wurden. Im Unterschied zur korrigierten Summe der Quadrate werden beim korrigierten Mittel der Quadrate die Freiheitsgrade berücksichtigt.

Der korrigierte mittlere quadrierte Fehler (auch als MSE oder s² bezeichnet) ist die Varianz um die angepassten Werte.

Interpretation

Minitab verwendet das korrigierte Mittel der Quadrate, um den p-Wert für einen Term zu berechnen. Außerdem verwendet Minitab das korrigierte Mittel der Quadrate, um das korrigierte R² zu berechnen. Im Allgemeinen interpretieren Sie die p-Werte und das korrigierte R² und nicht das korrigierte Mittel der Quadrate.

F-Wert

Für jeden Term in der Tabelle der Varianzanalyse wird ein F-Wert angezeigt:

F-Wert für das Modell oder für die Terme: Der F-Wert ist die Teststatistik, anhand derer bestimmt wird, ob eine Assoziation zwischen dem Term und der Antwortvariablen besteht.
F-Wert für den Test auf fehlende Anpassung: Der F-Wert ist die Teststatistik, mit der bestimmt wird, ob im Modell Terme höherer Ordnung fehlen, einschließlich der Prädiktoren des aktuellen Modells.

Interpretation

Minitab verwendet den F-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Ein hinreichend großer F-Wert weist darauf hin, dass der Term oder das Modell signifikant ist.

Wenn Sie mit dem F-Wert feststellen möchten, ob die Nullhypothese zurückzuweisen ist, vergleichen Sie den F-Wert mit dem kritischen Wert. Sie können den kritischen Wert in Minitab berechnen oder diesen einer in den meisten Fachbüchern vorhandenen Tabelle für die F-Verteilung entnehmen. Weitere Informationen zum Berechnen des kritischen Werts mit Hilfe von Minitab finden Sie unter Verwenden der inversen kumulativen Verteilungsfunktion (ICDF); klicken Sie dort auf „Verwenden der ICDF zum Berechnen von kritischen Werten“.

p-Wert

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Interpretation

Verwenden Sie den p-Wert in der ANOVA-Ausgabe, um zu ermitteln, ob die Differenzen zwischen einigen der Mittelwerte statistisch signifikant sind.

Um zu bestimmen, ob mindestens eine der Differenzen zwischen den Mittelwerten statistisch signifikant ist, vergleichen Sie den p-Wert mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass sämtliche Mittelwerte der Grundgesamtheiten gleich sind. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Differenz geschlossen wird, während tatsächlich keine vorhanden ist.

p-Wert ≤ α: Die Differenzen zwischen einigen der Mittelwerte sind statistisch signifikant.: Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, weisen Sie die Nullhypothese zurück und schlussfolgern, dass nicht alle Mittelwerte der Grundgesamtheiten gleich sind. Bestimmen Sie anhand Ihres Fachwissens, ob die Differenzen praktisch signifikant sind. Weitere Informationen finden Sie unter Statistische und praktische Signifikanz.
p-Wert > α: Die Differenzen zwischen den Mittelwerten sind statistisch nicht signifikant.: Wenn der p-Wert größer als das Signifikanzniveau ist, liegen keine ausreichenden Anzeichen zum Zurückweisen der Nullhypothese vor, die besagt, dass alle Mittelwerte der Grundgesamtheiten gleich sind. Vergewissern Sie sich, dass der Test über eine ausreichende Trennschärfe verfügt, um eine praktisch signifikante Differenz zu erkennen. Weitere Informationen finden Sie unter Steigern der Trennschärfe eines Hypothesentests.