Der Koeffizient beschreibt die Größe und die Richtung der Beziehung zwischen einem Term im Modell und der Antwortvariablen. Um die Multikollinearität zwischen den Termen zu minimieren, werden alle Koeffizienten in kodierten Einheiten angegeben.
Der Koeffizient für einen Term stellt die Änderung des Mittelwerts der Antwortvariablen bei einem Anstieg des betreffenden Terms um eine kodierte Einheit dar, wenn alle übrigen Terme auf konstanten Werten gehalten werden. Das Vorzeichen des Koeffizienten gibt die Richtung der Beziehung zwischen dem Term und der Antwortvariablen an. Die Größe des Effekts liefert keinen Hinweis darauf, ob ein Term statistisch signifikant ist, da bei den Berechnungen für die Signifikanz auch die Genauigkeit des Schätzwerts des Koeffizienten berücksichtigt wird. Untersuchen Sie den p-Wert für den Term, um die statistische Signifikanz zu ermitteln.
Für Terme, die keine Faktoren enthalten (z. B. Kovariatenterme und Blockterme), werden keine kodierten Einheiten verwendet. Diese Koeffizienten werden anders interpretiert.
Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Versuchsplan und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.
Verwenden Sie den Standardfehler des Koeffizienten, um die Genauigkeit des Schätzwerts für den Koeffizienten zu ermitteln. Je kleiner der Standardfehler, desto genauer ist der Schätzwert. Durch Dividieren des Koeffizienten durch seinen Standardfehler wird ein t-Wert berechnet. Wenn der dieser t-Statistik entsprechende p-Wert kleiner als das Signifikanzniveau ist, schlussfolgern Sie, dass der Koeffizient statistisch signifikant ist.
Diese Konfidenzintervalle (KIs) sind Bereiche von Werten, die wahrscheinlich den tatsächlichen Wert des Koeffizienten für jeden Term im Modell enthalten.
Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.
Verwenden Sie das Konfidenzintervall, um den Schätzwert des Koeffizienten der Grundgesamtheit für jeden Term im Modell zu beurteilen.
Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Koeffizienten für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.
Mit dem t-Wert wird das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen.
Minitab berechnet anhand des t-Werts den p-Wert, mit dem geprüft wird, ob sich der Koeffizient signifikant von 0 unterscheidet.
Anhand des t-Werts können Sie bestimmen, ob die Nullhypothese zurückgewiesen werden muss. Der p-Wert wird jedoch häufiger verwendet, da der Schwellenwert für die Zurückweisung der Nullhypothese unabhängig von den Freiheitsgraden ist. Weitere Informationen zum Verwenden des t-Werts finden Sie unter Verwenden des t-Werts, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Um zu bestimmen, ob sich ein Koeffizient von 0 unterscheidet, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient gleich 0 ist, was bedeutet, dass zwischen dem Term und der Antwortvariablen keine Assoziation besteht.
In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass der Koeffizient ungleich 0 ist, während er tatsächlich 0 ist, von 5 %.
Der Varianzinflationsfaktor (VIF) gibt an, wie groß die Inflation der Varianz eines Koeffizienten aufgrund der Korrelationen unter den Prädiktoren im Modell ist.
Verwenden Sie den VIF-Wert, um zu beschreiben, welcher Grad der Multikollinearität (Korrelation zwischen Prädiktoren) in einem Modell vorliegt. Meist liegen in Modellen für Screening-Versuchspläne ausschließlich Haupteffekte vor. In diesem Fall ist der VIF-Wert gleich 1, es sei denn, es sind Kovariaten oder misslungene Durchläufe vorhanden. Partielle Aliasbeziehungen, die bei Modellen für Screening-Versuchspläne häufig auftreten, verstärken die Multikollinearität. Die Multikollinearität erschwert das Ermitteln der statistischen Signifikanz. Durch das Einbinden von Kovariaten in das Modell und das Auftreten von misslungenen Durchläufen können VIF-Werte ebenfalls zunehmen. Interpretieren Sie den VIF-Wert anhand der folgenden Richtlinien:
VIF | Status des Prädiktors |
---|---|
VIF = 1 | Nicht korreliert |
1 < VIF < 5 | Mäßig korreliert |
VIF > 5 | Stark korreliert |
Gehen Sie mit Umsicht vor, wenn Multikollinearität vorliegt und Sie anhand der statistischen Signifikanz auswählen, welche Terme aus einem Modell entfernt werden sollen. Fügen Sie dem Modell jeweils nur einen Term hinzu bzw. entfernen Sie jeweils nur einen Term aus dem Modell. Überwachen Sie beim Ändern des Modells die Änderungen in den zusammenfassenden Statistiken sowie die Tests der statistischen Signifikanz.