Interpretieren der wichtigsten Ergebnisse für ANOVA für balancierte Daten

Führen Sie die folgenden Schritte aus, um eine ANOVA für balancierte Daten zu interpretieren. Zu den wichtigsten Ausgaben zählen der p-Wert, die Gruppenmittelwerte, R2 und die Residuendiagramme.

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, dass Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Für diese Analyse in Minitab muss das Modell hierarchisch sein. In einem hierarchischen Modell sind alle Terme niedriger Ordnung, aus denen sich die Terme höherer Ordnung zusammensetzen, ebenfalls im Modell enthalten. Ein Modell, das den Wechselwirkungsterm A*B*C enthält, ist beispielsweise hierarchisch, wenn es die folgenden Terme umfasst: A, B, C, A*B, A*C und B*C.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein fester Faktor signifikant ist, können Sie schlussfolgern, dass nicht alle Mittelwerte der Faktorstufen gleich sind.
  • Wenn ein Zufallsfaktor signifikant ist, können Sie schlussfolgern, dass der Faktor zum Grad der Streuung in der Antwortvariablen beiträgt.
  • Wenn ein Wechselwirkungsterm signifikant ist, hängt die Beziehung zwischen einem Faktor und der Antwortvariablen von den anderen Faktoren im Term ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen.

Verwenden Sie die Mittelwerttabelle, um die statistisch signifikanten Differenzen zwischen den Faktorstufen in den Daten zu ermitteln. Der Mittelwert jeder Gruppe ist ein Schätzwert für den Mittelwert der Grundgesamtheit. Suchen Sie nach Differenzen zwischen Gruppenmittelwerten für Terme, die statistisch signifikant sind.

Für die Haupteffekte werden die Gruppen innerhalb der einzelnen Faktoren und die entsprechenden Mittelwerte in der Tabelle angezeigt. Für die Wechselwirkungseffekte werden alle möglichen Kombinationen der Gruppen in der Tabelle angezeigt. Wenn ein Wechselwirkungsterm statistisch signifikant ist, interpretieren Sie die Haupteffekte nur unter Berücksichtigung der Wechselwirkungseffekte.

ANOVA: Stärke vs. Zeit; Bediener; Einstellung

Faktorinformationen Faktor Typ Stufen Werte Zeit Fest 2 1; 2 Bediener Zufällig 3 1; 2; 3 Einstellung Fest 3 35; 44; 52
Varianzanalyse für Stärke Quelle DF SS MS F p Zeit 1 9,0 9,00 0,29 0,644 Bediener 2 1120,9 560,44 4,28 0,081 x Einstellung 2 15676,4 7838,19 73,18 0,001 Zeit*Bediener 2 62,0 31,00 4,34 0,026 Zeit*Einstellung 2 114,5 57,25 8,02 0,002 Bediener*Einstellung 4 428,4 107,11 15,01 0,000 Fehler 22 157,0 7,14 Gesamt 35 17568,2 x Kein genauer F-Test.
Zusammenfassung des Modells S R-Qd R-Qd(kor) 2,67140 99,11% 98,58%
Mittelwerte Zeit N Stärke 1 18 67,7222 2 18 68,7222
Einstellung N Stärke 35 12 40,5833 44 12 73,0833 52 12 91,0000
Zeit*Einstellung N Stärke 1 35 6 40,6667 1 44 6 70,1667 1 52 6 92,3333 2 35 6 40,5000 2 44 6 76,0000 2 52 6 89,6667
Wichtigste Ergebnisse: p-Wert, Mittelwerttabelle

„Einstellung“ ist ein fester Faktor, und dieser Haupteffekt ist signifikant. Dieses Ergebnis weist darauf hin, dass die mittlere Beschichtungsstärke nicht für alle Maschineneinstellungen gleich ist.

„Zeit*Einstellung“ ist ein Wechselwirkungseffekt, der zwei feste Faktoren umfasst. Dieser Wechselwirkungseffekt ist signifikant, was darauf verweist, dass die Beziehung zwischen den einzelnen Faktoren und der Antwortvariablen von der Stufe des jeweils anderen Faktors abhängt. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen.

In diesen Ergebnissen wird in der Mittelwerttabelle angezeigt, wie sich die mittlere Stärke in Abhängigkeit von Zeit, Maschineneinstellung und jeder Kombination von Zeit und Maschineneinstellung ändert. Die Einstellung ist statistisch signifikant, und die Mittelwerte variieren zwischen den Maschineneinstellungen. Da der Wechselwirkungsterm „Zeit*Einstellung“ jedoch ebenfalls statistisch signifikant ist, können Sie die Haupteffekte nur unter Berücksichtigung der Wechselwirkungseffekte interpretieren. In der Tabelle für den Wechselwirkungsterm wird beispielsweise ersichtlich, dass Zeit 2 bei einer Einstellung von 44 mit einer stärkeren Beschichtung verbunden ist. Bei einer Einstellung von 52 ist jedoch Zeit 1 mit einer stärkeren Beschichtung verbunden.

„Bediener“ ist ein Zufallsfaktor, und alle Wechselwirkungen, die einen Zufallsfaktor umfassen, werden als zufällig erachtet. Wenn ein Zufallsfaktor signifikant ist, können Sie schlussfolgern, dass der Faktor zum Grad der Streuung in der Antwortvariablen beiträgt. Der Bediener ist auf dem Niveau 0,05 nicht signifikant, die Wechselwirkungseffekte mit dem Bediener sind hingegen signifikant. Diese Wechselwirkungseffekte zeigen, dass der Grad der Streuung, der von dem Bediener zur Antwortvariablen beigetragen wird, vom Wert für die Zeit und die Maschineneinstellung abhängt.

Schritt 2: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.

S

Verwenden Sie S, um zu ermitteln, wie genau das Modell die Antwortvariable beschreibt. Verwenden Sie S anstelle von R2, um die Anpassung von Modellen zu vergleichen, die keine Konstante enthalten.

S wird in der Maßeinheit der Antwortvariablen ausgedrückt und stellt den Abstand der Datenwerte von den angepassten Werten in Standardabweichungen dar. Je niedriger der Wert von S, desto genauer beschreibt das Modell die Antwortvariable. Ein niedriger Wert von S allein bedeutet jedoch nicht zwangsläufig, dass das Modell die Modellannahmen erfüllt. Prüfen Sie die Annahmen anhand der Residuendiagramme.

R-Qd

Je höher das R2, desto besser ist das Modell an die Daten angepasst. Das R2 liegt immer zwischen 0 % und 100 %.

Der Wert von R2 nimmt beim Einbinden zusätzlicher Prädiktoren in das Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist R2 am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

R-Qd(kor)

Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. R2 nimmt stets zu, wenn Sie einen zusätzlichen Prädiktor in das Modell aufnehmen, selbst wenn damit keine tatsächliche Verbesserung des Modells verbunden ist. Der Wert des korrigierten R2 berücksichtigt die Anzahl der Prädiktoren im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.

Untersuchen Sie die folgenden Punkte, wenn Sie die Werte von R2 interpretieren:
  • Kleine Stichproben ermöglichen keinen genauen Schätzwert für die Stärke der Beziehung zwischen der Antwortvariablen und den Prädiktoren. Wenn R2 genauer sein muss, sollten Sie einen größeren Stichprobenumfang (im Allgemeinen 40 oder mehr) wählen.

  • R2 ist nur eines der Maß für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell ein hohes R2 aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.

Regressionsanalyse: Stärke vs. Zeit; Bediener; Einstellung

Zusammenfassung des Modells S R-Qd R-Qd(kor) 2,67140 99,11% 98,58%
Wichtigste Ergebnisse: S, R-Qd, R-Qd(kor)

In diesen Ergebnissen erklärt das Modell 99,11 % der Streuung in der Beschichtungsstärke. Für diese Daten gibt das R2 an, dass das Modell gut an die Daten angepasst ist. Wenn Sie weitere Modelle mit anderen Prädiktoren anpassen, verwenden Sie die Werte des korrigierten R2, um die Güte der Anpassung der Modelle an die Daten zu vergleichen.

Schritt 3: Bestimmen, ob das Modell die Annahmen der Analyse erfüllt

Verwenden Sie die Residuendiagramme, um zu ermitteln, ob das Modell angemessen ist und die Annahmen der Analyse erfüllt. Wenn die Annahmen nicht erfüllt werden, ist das Modell u. U. nicht gut an die Daten angepasst, und Sie sollten beim Interpretieren der Ergebnisse vorsichtig sein.

Weitere Informationen zum Umgang mit Mustern in den Residuendiagrammen finden Sie unter Residuendiagramme für Allgemeines lineares Modell anpassen; klicken Sie dort auf den Namen des Residuendiagramms in der Liste am oberen Rand der Seite.

Diagramm der Residuen im Vergleich zu den Anpassungen

Verwenden Sie das Diagramm der Residuen im Vergleich zu den Anpassungen, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind und eine konstante Varianz aufweisen. Im Idealfall sollten die Punkte zufällig auf beiden Seiten von null verteilt sein, und es sollten keine Muster in den Punkten erkennbar sein.

Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt.
Muster Mögliche Bedeutung des Musters
Aufgefächerte oder ungleichmäßig gestreute Residuen für die angepassten Werte Nicht konstante Varianz
Krümmung Ein fehlender Term höherer Ordnung
Ein weit von null entfernt liegender Punkt Ein Ausreißer
Ein in x-Richtung weit von den anderen Punkten entfernter Punkt Ein einflussreicher Punkt
In diesem Diagramm der Residuen im Vergleich zu den Anpassungen scheinen die Daten zufällig um null gestreut zu sein. Es liegen keine Anzeichen dafür vor, dass der Wert des Residuums vom angepassten Wert abhängt.

Diagramm der Residuen im Vergleich zur Reihenfolge

Verwenden Sie das Diagramm der Residuen im Vergleich zur Reihenfolge, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind. Bei in chronologischer Reihenfolge angezeigten unabhängigen Residuen sind weder Trends noch Muster zu erkennen. Muster in den Punkten können darauf hinweisen, dass nahe beieinander liegende Residuen korrelieren und daher nicht unabhängig sind. Im Idealfall sollten die Residuen im Diagramm zufällig um die Mittellinie gestreut sein:
Wenn Sie ein Muster erkennen, untersuchen Sie die Ursache. Die folgenden Typen von Mustern können darauf hinweisen, dass die Residuen abhängig sind.
Trend
Shift
Zyklus
In diesem Diagramm der Residuen im Vergleich zur Reihenfolge scheinen die Residuen zufällig um die Mittellinie gestreut zu sein. Es liegen keine Anzeichen dafür vor, dass die Residuen nicht unabhängig sind.

Wahrscheinlichkeitsnetz für Normalverteilung

Verwenden Sie das Wahrscheinlichkeitsnetz (Normal) der Residuen, um die Annahme zu überprüfen, dass die Residuen normalverteilt sind. Die Residuen im Wahrscheinlichkeitsnetz für Normalverteilung sollten ungefähr einer Geraden folgen.

Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt.
Muster Mögliche Bedeutung des Musters
Keine Gerade Nicht-Normalverteilung
Ein Punkt weit entfernt von der Linie Ein Ausreißer
Unbeständige Steigung Eine nicht identifizierte Variable
In diesem Wahrscheinlichkeitsnetz (Normal) für Residuen scheinen die Punkte durchgängig einer Geraden zu folgen. Es liegen keine Anzeichen für Nicht-Normalverteilung, Ausreißer oder nicht identifizierte Variablen vor.
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien