Interpretieren der wichtigsten Ergebnisse für Modell mit gemischten Effekten anpassen

Führen Sie die folgenden Schritte aus, um ein Modell mit gemischten Effekten zu interpretieren.

Schritt 1: Bestimmen, ob die Zufallsterme die Antwortvariable signifikant beeinflussen

Um zu bestimmen, ob ein Zufallsterm signifikante Auswirkungen auf die Antwortvariable hat, vergleichen Sie den p-Wert für den Term in der Varianzkomponententabelle mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf einen vorhandenen Effekt geschlossen wird, während tatsächlich keiner vorhanden ist.
p-Wert ≤ α: Der Zufallsterm wirkt sich signifikant auf die Antwortvariable aus
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass der Zufallsterm die Antwortvariable signifikant beeinflusst. Das heißt, dass sich die Varianz des Zufallsterms signifikant von null unterscheidet.
p-Wert > α: Der Zufallsterm wirkt sich nicht signifikant auf die Antwortvariable aus
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass sich der Zufallsterm signifikant auf die Antwortvariable auswirkt. Es empfiehlt sich u. U., das Modell ohne den nicht signifikanten Term erneut anzupassen, um den Effekt des Terms auf andere Ergebnisse zu untersuchen.

Varianzkomponenten

QuelleVar% von GesamtSE Varz-Wertp-Wert
Feld0,07791972,93%0,0675801,1529960,124
Fehler0,02892427,07%0,0105622,7386130,003
Gesamt0,106843       
-2 Log-Likelihood = 7,736012
Wichtigste Ergebnisse: p-Wert

In diesen Ergebnissen ist „Feld“ der Zufallsterm, und der p-Wert für „Feld“ ist gleich 0,124. Da dieser Wert größer als 0,05 ist, liegen keine ausreichenden Hinweise für die Schlussfolgerung vor, dass andere Felder zur Streuung im Ertrag beitragen.

Schritt 2: Bestimmen, ob die Terme mit festen Effekten die Antwortvariable signifikant beeinflussen

Um zu bestimmen, ob ein Term signifikante Auswirkungen auf die Antwortvariable hat, vergleichen Sie den p-Wert mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Auswirkung geschlossen wird, während tatsächlich keine vorhanden ist.

Die Interpretation der einzelnen p-Werte hängt davon ab, ob er zu einem Koeffizienten eines Terms mit festem Faktor oder zu einem Kovariatenterm gehört.

Term mit festem Faktor

Für einen Term mit einem festen Faktor besagt die Nullhypothese, dass der Term mit festem Faktor keine signifikante Auswirkung auf die Antwortvariable hat.
p-Wert ≤ α: Der Term mit festem Faktor wirkt sich signifikant auf die Antwortvariable aus

Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass der Term mit festem Faktor die Antwortvariable signifikant beeinflusst. Wird die Nullhypothese zurückgewiesen, deutet dies darauf hin, dass sich der Effekt einer Stufe signifikant von den Effekten der anderen Stufen des Terms unterscheidet.

p-Wert > α: Der Term mit festem Faktor wirkt sich nicht signifikant auf die Antwortvariable aus
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass sich der Term mit festem Faktor signifikant auf die Antwortvariable auswirkt. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.

Kovariatenterm

Für einen Kovariatenterm besagt die Nullhypothese, dass zwischen dem Term und der Antwortvariablen keine Assoziation besteht.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Kovariatenterm besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Kovariatenterm besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Kovariatenterm erneut anzupassen.

Tests auf feste Effekte

TermDF des
Zählers
DF des
Nenners
F-Wertp-Wert
Sorte5,0015,0026,290,000
Wichtigste Ergebnisse: p-Werte

„Sorte“ ist der Term mit festem Faktor, und der p-Wert für den Term „Sorte“ ist kleiner als 0,000. Da dieser Wert kleiner als 0,05 ist, können Sie schlussfolgern, dass nicht alle Stufenmittelwerte gleich sind, d. h., dass die Sorte der Luzerne einen Effekt auf die Ausbeute hat.

Ein besseres Verständnis zu den Haupteffekten können Sie unter Faktordiagramme erlangen.

Schritt 3: Bestimmen, wie gut das Modell an die Daten angepasst ist

Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.

S

S ist die geschätzte Standardabweichung des Fehlerterms. Je kleiner der Wert von S, desto besser beschreibt die angepasste Gleichung der bedingten Werte die Antwortvariable bei den ausgewählten Faktoreinstellungen. Mit einem S-Wert allein kann die Adäquatheit des Modells jedoch nicht umfassend beschrieben werden. Untersuchen Sie daher die wichtigsten Ergebnisse aus anderen Tabellen und die Residuendiagramme.

R-Qd

R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der durch das Modell erklärt wird. Der Wert wird wie folgt berechnet: 1 minus das Verhältnis zwischen der Summe der quadrierten Fehler (Streuung, die durch das Modell nicht erklärt wird) zur Gesamtsumme der Quadrate (Gesamtstreuung im Modell).

R-Qd(kor)

Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die zwar die gleiche Kovarianzstruktur, jedoch eine unterschiedliche Anzahl von festen Faktoren und Kovariaten aufweisen. Angenommen, die Modelle weisen die gleiche Kovarianzstruktur auf; in diesem Fall vergrößert sich R2, wenn Sie weitere feste Faktoren oder Kovariaten hinzufügen. Der Wert des korrigierten R2 berücksichtigt die Anzahl der festen Faktoren und Kovariaten im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.

AICc und BIC
Wenn Sie die erweiterten Ergebnisse der Analyse abrufen, zeigt Minitab zwei weitere Statistiken an. Bei diesen Statistiken handelt es sich um Akaikes korrigiertes Informationskriterium (AICc) und das Bayessche Informationskriterium (BIC). Anhand dieser Statistiken können Sie verschiedene Modelle vergleichen. Bei beiden Statistiken sind kleinere Werte erwünscht.
Berücksichtigen Sie die folgenden Punkte, wenn Sie die Statistiken für die Güte der Anpassung interpretieren:
  • Wenn Sie präzisere und weniger verzerrte Schätzwerte für die Parameter in einem Modell erhalten möchten, sollte die Anzahl der Zeilen in einem Datensatz im Allgemeinen viel größer als die Anzahl der Parameter im Modell sein. Um hinreichend gute Schätzwerte für die Varianzkomponenten der Zufallsterme zu erhalten, sollten Sie über eine ausreichende Anzahl von repräsentativen Stufen für jeden Zufallsfaktor verfügen.

  • Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.

Zusammenfassung des Modells

SR-QdR-Qd(kor)AICcBIC
0,17007192,33%90,20%12,5413,52
Wichtigste Ergebnisse: S, R-Qd, R-Qd(kor)

In diesen Ergebnissen beläuft sich die geschätzte Standardabweichung (S) des zufälligen Fehlerterms auf 0,17. Das Modell erklärt 92,33 % der Streuung in der Ausbeute von Luzernepflanzen. Nach der Korrektur für die Anzahl der Parameter des festen Faktors im Modell verringert sich der Prozentsatz auf 90,2 %.

Schritt 4: Bewerten, wie die einzelnen Stufen eines Terms mit festem Effekt die Antwortvariable beeinflussen

Wenn der p-Wert auf einen signifikanten Term hindeutet, können Sie die Koeffizienten für den Term untersuchen, um das Verhältnis des Terms zur Antwortvariablen zu bestimmen. Die Interpretation der einzelnen Koeffizienten hängt davon ab, ob er zu einem Term mit festem Faktor oder zu einem Kovariatenterm gehört.

Die Koeffizienten für einen Term mit einem festen Faktor geben an, wie sich die Stufenmittelwerte für den Term unterscheiden. Sie können auch eine Analyse mit Mehrfachvergleichen für den Term durchführen, um die Stufeneffekte in Gruppen zu klassifizieren, die statistisch gleich sind oder sich statistisch unterscheiden.

Der Koeffizient für einen Kovariatenterm stellt die Änderung des Mittelwerts der Antwortvariablen bei einer Änderung des betreffenden Terms um eine Einheit dar, wenn alle übrigen Elemente im Modell unverändert beibehalten werden. Das Vorzeichen des Koeffizienten gibt die Richtung der Beziehung zwischen dem Term und der Antwortvariablen an. Die Größe des Koeffizienten bietet in der Regel einen guten Anhaltspunkt, um die praktische Signifikanz des Terms für die Antwortvariable zu beurteilen.

Koeffizienten

TermKoefSE KoefDFt-Wertp-Wert
Konstante3,0945830,1438223,0021,5166920,000
Sorte         
  10,3854170,07762615,004,9650160,000
  20,1454170,07762615,001,8732870,081
  30,1079170,07762615,001,3902050,185
  4-0,3195830,07762615,00-4,1169380,001
  50,3954170,07762615,005,0938380,000
Wichtigste Ergebnisse: Koeffizienten

Für die sechs Luzernesorten in der Untersuchung werden in der Ausgabe die Koeffizienten für fünf Typen angezeigt. In der Standardeinstellung entfernt Minitab eine Faktorstufe, um vollkommene Multikollinearität zu vermeiden. Die Koeffizienten für die Haupteffekte stellen die Differenz zwischen den einzelnen Stufenmittelwerten und dem Gesamtmittelwert dar. Sorte 1 ist beispielsweise einer Luzerneausbeute zugeordnet, die um ca. 0,385 Einheiten über dem Gesamtmittelwert liegt.

Schritt 5: Bestimmen, ob das Modell die Annahmen der Analyse erfüllt

Verwenden Sie die Residuendiagramme, um zu ermitteln, ob das Modell angemessen ist und die Annahmen der Analyse erfüllt. Wenn die Annahmen nicht erfüllt werden, ist das Modell u. U. nicht gut an die Daten angepasst, und Sie sollten beim Interpretieren der Ergebnisse vorsichtig sein.

Hinweis

Sie können Randresiduen und bedingte Residuen darstellen. Ein Randresiduum entspricht der Differenz zwischen einem beobachteten Wert der Antwortvariablen und dem entsprechenden geschätzten Mittelwert der Antwortvariablen, ohne dass eine Abhängigkeit von den Stufen der Zufallsfaktoren besteht. Im Gegensatz dazu entspricht bei Berücksichtigung der spezifischen Stufen der Zufallsfaktoren ein bedingtes Residuum der Differenz zwischen einem beobachteten Wert der Antwortvariablen und dem entsprechenden bedingten Mittelwert der Antwortvariablen. Verwenden Sie die bedingten Residuen, um zu prüfen, ob der Fehlerterm im Modell normalverteilt ist.

Diagramm der Residuen im Vergleich zu den Anpassungen

Im Diagramm der Residuen im Vergleich zu den Anpassungen werden die Residuen auf der y-Achse und die angepassten Werte auf der x-Achse abgetragen. Ermitteln Sie anhand dieser Grafik Datenzeilen, die erheblich größere Residuen als die übrigen Zeilen aufweisen. Untersuchen Sie die betreffenden Zeilen eingehender, um festzustellen, ob sie ordnungsgemäß erfasst wurden. Darüber hinaus können Sie mit diesem Diagramm nach bestimmten Mustern in den Residuen suchen, die möglicherweise auf weitere zu berücksichtigende Variablen hindeuten.

Diagramm der Residuen im Vergleich zur Reihenfolge

Das Diagramm der Residuen im Vergleich zur Reihenfolge zeigt die Residuen in der Reihenfolge an, in der die Daten erfasst wurden. Ermitteln Sie anhand dieser Grafik Datenzeilen, die erheblich größere Residuen als die übrigen Zeilen aufweisen. Untersuchen Sie die betreffenden Zeilen eingehender, um festzustellen, ob sie ordnungsgemäß erfasst wurden. Wird im Diagramm ein Muster in chronologischer Reihenfolge sichtbar, können Sie versuchen, einen zeitabhängigen Term in das Modell einzuschließen und auf diese Weise das Muster zu entfernen.