Quelle | Var | % von Gesamt | SE Var | z-Wert | p-Wert |
---|---|---|---|---|---|
Feld | 0,077919 | 72,93% | 0,067580 | 1,152996 | 0,124 |
Fehler | 0,028924 | 27,07% | 0,010562 | 2,738613 | 0,003 |
Gesamt | 0,106843 |
In diesen Ergebnissen ist „Feld“ der Zufallsterm, und der p-Wert für „Feld“ ist gleich 0,124. Da dieser Wert größer als 0,05 ist, liegen keine ausreichenden Hinweise für die Schlussfolgerung vor, dass andere Felder zur Streuung im Ertrag beitragen.
Um zu bestimmen, ob ein Term signifikante Auswirkungen auf die Antwortvariable hat, vergleichen Sie den p-Wert mit dem Signifikanzniveau. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Auswirkung geschlossen wird, während tatsächlich keine vorhanden ist.
Die Interpretation der einzelnen p-Werte hängt davon ab, ob er zu einem Koeffizienten eines Terms mit festem Faktor oder zu einem Kovariatenterm gehört.
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass der Term mit festem Faktor die Antwortvariable signifikant beeinflusst. Wird die Nullhypothese zurückgewiesen, deutet dies darauf hin, dass sich der Effekt einer Stufe signifikant von den Effekten der anderen Stufen des Terms unterscheidet.
Term | DF des Zählers | DF des Nenners | F-Wert | p-Wert |
---|---|---|---|---|
Sorte | 5,00 | 15,00 | 26,29 | 0,000 |
„Sorte“ ist der Term mit festem Faktor, und der p-Wert für den Term „Sorte“ ist kleiner als 0,000. Da dieser Wert kleiner als 0,05 ist, können Sie schlussfolgern, dass nicht alle Stufenmittelwerte gleich sind, d. h., dass die Sorte der Luzerne einen Effekt auf die Ausbeute hat.
Ein besseres Verständnis zu den Haupteffekten können Sie unter Faktordiagramme erlangen.
Um zu ermitteln, wie gut das Modell an die Daten angepasst ist, untersuchen Sie die Statistiken für die Güte der Anpassung in der Tabelle „Zusammenfassung des Modells“.
S ist die geschätzte Standardabweichung des Fehlerterms. Je kleiner der Wert von S, desto besser beschreibt die angepasste Gleichung der bedingten Werte die Antwortvariable bei den ausgewählten Faktoreinstellungen. Mit einem S-Wert allein kann die Adäquatheit des Modells jedoch nicht umfassend beschrieben werden. Untersuchen Sie daher die wichtigsten Ergebnisse aus anderen Tabellen und die Residuendiagramme.
R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der durch das Modell erklärt wird. Der Wert wird wie folgt berechnet: 1 minus das Verhältnis zwischen der Summe der quadrierten Fehler (Streuung, die durch das Modell nicht erklärt wird) zur Gesamtsumme der Quadrate (Gesamtstreuung im Modell).
Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die zwar die gleiche Kovarianzstruktur, jedoch eine unterschiedliche Anzahl von festen Faktoren und Kovariaten aufweisen. Angenommen, die Modelle weisen die gleiche Kovarianzstruktur auf; in diesem Fall vergrößert sich R2, wenn Sie weitere feste Faktoren oder Kovariaten hinzufügen. Der Wert des korrigierten R2 berücksichtigt die Anzahl der festen Faktoren und Kovariaten im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.
Wenn Sie präzisere und weniger verzerrte Schätzwerte für die Parameter in einem Modell erhalten möchten, sollte die Anzahl der Zeilen in einem Datensatz im Allgemeinen viel größer als die Anzahl der Parameter im Modell sein. Um hinreichend gute Schätzwerte für die Varianzkomponenten der Zufallsterme zu erhalten, sollten Sie über eine ausreichende Anzahl von repräsentativen Stufen für jeden Zufallsfaktor verfügen.
Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.
S | R-Qd | R-Qd(kor) | AICc | BIC |
---|---|---|---|---|
0,170071 | 92,33% | 90,20% | 12,54 | 13,52 |
In diesen Ergebnissen beläuft sich die geschätzte Standardabweichung (S) des zufälligen Fehlerterms auf 0,17. Das Modell erklärt 92,33 % der Streuung in der Ausbeute von Luzernepflanzen. Nach der Korrektur für die Anzahl der Parameter des festen Faktors im Modell verringert sich der Prozentsatz auf 90,2 %.
Wenn der p-Wert auf einen signifikanten Term hindeutet, können Sie die Koeffizienten für den Term untersuchen, um das Verhältnis des Terms zur Antwortvariablen zu bestimmen. Die Interpretation der einzelnen Koeffizienten hängt davon ab, ob er zu einem Term mit festem Faktor oder zu einem Kovariatenterm gehört.
Die Koeffizienten für einen Term mit einem festen Faktor geben an, wie sich die Stufenmittelwerte für den Term unterscheiden. Sie können auch eine Analyse mit Mehrfachvergleichen für den Term durchführen, um die Stufeneffekte in Gruppen zu klassifizieren, die statistisch gleich sind oder sich statistisch unterscheiden.
Der Koeffizient für einen Kovariatenterm stellt die Änderung des Mittelwerts der Antwortvariablen bei einer Änderung des betreffenden Terms um eine Einheit dar, wenn alle übrigen Elemente im Modell unverändert beibehalten werden. Das Vorzeichen des Koeffizienten gibt die Richtung der Beziehung zwischen dem Term und der Antwortvariablen an. Die Größe des Koeffizienten bietet in der Regel einen guten Anhaltspunkt, um die praktische Signifikanz des Terms für die Antwortvariable zu beurteilen.
Term | Koef | SE Koef | DF | t-Wert | p-Wert |
---|---|---|---|---|---|
Konstante | 3,094583 | 0,143822 | 3,00 | 21,516692 | 0,000 |
Sorte | |||||
1 | 0,385417 | 0,077626 | 15,00 | 4,965016 | 0,000 |
2 | 0,145417 | 0,077626 | 15,00 | 1,873287 | 0,081 |
3 | 0,107917 | 0,077626 | 15,00 | 1,390205 | 0,185 |
4 | -0,319583 | 0,077626 | 15,00 | -4,116938 | 0,001 |
5 | 0,395417 | 0,077626 | 15,00 | 5,093838 | 0,000 |
Für die sechs Luzernesorten in der Untersuchung werden in der Ausgabe die Koeffizienten für fünf Typen angezeigt. In der Standardeinstellung entfernt Minitab eine Faktorstufe, um vollkommene Multikollinearität zu vermeiden. Die Koeffizienten für die Haupteffekte stellen die Differenz zwischen den einzelnen Stufenmittelwerten und dem Gesamtmittelwert dar. Sorte 1 ist beispielsweise einer Luzerneausbeute zugeordnet, die um ca. 0,385 Einheiten über dem Gesamtmittelwert liegt.
Verwenden Sie die Residuendiagramme, um zu ermitteln, ob das Modell angemessen ist und die Annahmen der Analyse erfüllt. Wenn die Annahmen nicht erfüllt werden, ist das Modell u. U. nicht gut an die Daten angepasst, und Sie sollten beim Interpretieren der Ergebnisse vorsichtig sein.
Sie können Randresiduen und bedingte Residuen darstellen. Ein Randresiduum entspricht der Differenz zwischen einem beobachteten Wert der Antwortvariablen und dem entsprechenden geschätzten Mittelwert der Antwortvariablen, ohne dass eine Abhängigkeit von den Stufen der Zufallsfaktoren besteht. Im Gegensatz dazu entspricht bei Berücksichtigung der spezifischen Stufen der Zufallsfaktoren ein bedingtes Residuum der Differenz zwischen einem beobachteten Wert der Antwortvariablen und dem entsprechenden bedingten Mittelwert der Antwortvariablen. Verwenden Sie die bedingten Residuen, um zu prüfen, ob der Fehlerterm im Modell normalverteilt ist.
Im Diagramm der Residuen im Vergleich zu den Anpassungen werden die Residuen auf der y-Achse und die angepassten Werte auf der x-Achse abgetragen. Ermitteln Sie anhand dieser Grafik Datenzeilen, die erheblich größere Residuen als die übrigen Zeilen aufweisen. Untersuchen Sie die betreffenden Zeilen eingehender, um festzustellen, ob sie ordnungsgemäß erfasst wurden. Darüber hinaus können Sie mit diesem Diagramm nach bestimmten Mustern in den Residuen suchen, die möglicherweise auf weitere zu berücksichtigende Variablen hindeuten.
Das Diagramm der Residuen im Vergleich zur Reihenfolge zeigt die Residuen in der Reihenfolge an, in der die Daten erfasst wurden. Ermitteln Sie anhand dieser Grafik Datenzeilen, die erheblich größere Residuen als die übrigen Zeilen aufweisen. Untersuchen Sie die betreffenden Zeilen eingehender, um festzustellen, ob sie ordnungsgemäß erfasst wurden. Wird im Diagramm ein Muster in chronologischer Reihenfolge sichtbar, können Sie versuchen, einen zeitabhängigen Term in das Modell einzuschließen und auf diese Weise das Muster zu entfernen.