S ist die geschätzte Standardabweichung des Fehlerterms. Je kleiner der Wert von S, desto besser beschreibt die angepasste Gleichung der bedingten Werte die Antwortvariable bei den ausgewählten Faktoreinstellungen. Mit einem S-Wert allein kann die Adäquatheit des Modells jedoch nicht umfassend beschrieben werden. Untersuchen Sie daher die wichtigsten Ergebnisse aus anderen Tabellen und die Residuendiagramme.
R2 gibt den Prozentsatz der Streuung der Antwortvariablen an, der durch das Modell erklärt wird. Der Wert wird wie folgt berechnet: 1 minus das Verhältnis zwischen der Summe der quadrierten Fehler (Streuung, die durch das Modell nicht erklärt wird) zur Gesamtsumme der Quadrate (Gesamtstreuung im Modell).
Verwenden Sie das R2, um zu ermitteln, wie gut das Modell an die Daten angepasst ist. Je höher der R2-Wert, desto mehr Streuung in den Werten der Antwortvariablen wird durch das Modell erklärt. Das R2 liegt immer zwischen 0 % und 100 %.
Angenommen, die Modelle weisen die gleiche Kovarianzstruktur auf; in diesem Fall vergrößert sich R2, wenn Sie weitere feste Faktoren oder Kovariaten hinzufügen. Daher ist R2 am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.
Kleine Stichproben ermöglichen keinen genauen Schätzwert für die Stärke der Beziehung zwischen der Antwortvariablen und den Prädiktoren. Wenn z. B. das R2 genauer sein muss, sollten Sie einen größeren Stichprobenumfang (im Allgemeinen 40 oder mehr) wählen.
Statistiken für die Güte der Anpassung sind nur eines der Maße für die Güte der Anpassung des Modells an die Daten. Selbst wenn ein Modell einen erwünschten Wert aufweist, sollten Sie die Residuendiagramme untersuchen, um sich zu vergewissern, dass das Modell die Modellannahmen erfüllt.
Verwenden Sie das korrigierte R2, wenn Sie Modelle vergleichen möchten, die zwar die gleiche Kovarianzstruktur, jedoch eine unterschiedliche Anzahl von festen Faktoren und Kovariaten aufweisen. Angenommen, die Modelle weisen die gleiche Kovarianzstruktur auf; in diesem Fall vergrößert sich R2, wenn Sie weitere feste Faktoren oder Kovariaten hinzufügen. Der Wert des korrigierten R2 berücksichtigt die Anzahl der festen Faktoren und Kovariaten im Modell, so dass Ihnen das Auswählen des richtigen Modells erleichtert wird.
Akaikes korrigiertes Informationskriterium (AICc) und das Bayessche Informationskriterium (BIC) sind Maße der relativen Qualität eines Modells, bei dem sowohl die Anpassung als auch die Anzahl der Terme im Modell berücksichtigt werden.
Anhand des AICc und des BIC können Sie verschiedene Modelle vergleichen. Erwünscht sind kleinere Werte. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie auch die Tests und Residuendiagramme, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.
Sowohl AICc als auch BIC werten die Likelihood des Modells aus und wenden dann einen Abzug für das Hinzufügen von Termen zum Modell an. Durch den Abzug wird die Tendenz zur Überanpassung des Modells an die Stichprobendaten reduziert. Durch diese Reduzierung kann ein Modell zustande kommen, das insgesamt eine bessere Leistung erbringt.
Als Faustregel gilt: Wenn die Anzahl der Parameter im Verhältnis zum Stichprobenumfang klein ist, ist der Abzug für das Hinzufügen der einzelnen Parameter für BIC größer als für AICc. In diesen Fällen ist das Modell, bei dem BIC minimiert wird, tendenziell kleiner als das Modell, bei dem AICc minimiert wird.
In einigen gängigen Fällen, z. B. bei Screening-Versuchsplänen, ist die Anzahl der Parameter im Verhältnis zum Stichprobenumfang in der Regel groß. In diesen Fällen ist das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird. Bei einem definitiven Screening-Versuchsplan mit 13 Durchläufen ist beispielsweise in der Gruppe der Modelle mit 6 oder mehr Parametern das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird.
Weitere Informationen zu AICc und BIC finden Sie in Burnham und Anderson.1