Ein Regressionskoeffizient beschreibt die Größe und Richtung der Beziehung zwischen einem Prädiktor und der Antwortvariablen. Koeffizienten sind die Zahlen, mit denen die Werte des Terms in einer Regressionsgleichung multipliziert werden.
Wenn Wechselwirkungen vorliegen, ist die Interpretation der Koeffizienten komplex. In diesen Ergebnissen möchte ein Qualitätstechniker die Haltbarkeit eines neuen Medikaments schätzen. Der negative Koeffizient für Charge 1 zeigt, dass das Medikament in Charge 1 einen geringeren Wirkstoffgehalt aufweist als das Medikament auf der Referenzstufe, bei der es sich um Charge 6 handelt. Der Koeffizient für die Wechselwirkung Monat*Charge für Charge 1 ist jedoch positiv. Der Effekt der Zeit hängt von der Charge ab, daher ändert sich die Differenz zwischen Charge 1 und Charge 6 über Zeit.
Die Größe des Koeffizienten bietet in der Regel einen guten Anhaltspunkt, um die praktische Signifikanz des Effekts eines Terms auf die Antwortvariable zu beurteilen. Die Größe des Koeffizienten liefert jedoch keinen Hinweis darauf, ob ein Term statistisch signifikant ist, da bei den Berechnungen für die Signifikanz auch die Streuung der Daten der Antwortvariablen berücksichtigt wird. Untersuchen Sie den p-Wert für den Term, um die statistische Signifikanz zu ermitteln.
Term | Koef | SE Koef | t-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | 100,085 | 0,143 | 701,82 | 0,000 | |
Monat | -0,13633 | 0,00769 | -17,74 | 0,000 | 1,07 |
Charge | |||||
1 | -0,232 | 0,292 | -0,80 | 0,432 | 3,85 |
2 | 0,068 | 0,292 | 0,23 | 0,818 | 3,85 |
3 | 0,394 | 0,275 | 1,43 | 0,162 | 3,41 |
4 | -0,317 | 0,292 | -1,08 | 0,287 | 3,85 |
5 | 0,088 | 0,275 | 0,32 | 0,752 | * |
Monat*Charge | |||||
1 | 0,0454 | 0,0164 | 2,76 | 0,010 | 4,52 |
2 | -0,0241 | 0,0164 | -1,47 | 0,152 | 4,52 |
3 | -0,0267 | 0,0136 | -1,96 | 0,060 | 3,65 |
4 | 0,0014 | 0,0164 | 0,08 | 0,935 | 4,52 |
5 | 0,0040 | 0,0136 | 0,30 | 0,769 | * |
Der Standardfehler des Koeffizienten ist ein Schätzwert der Unsicherheit, die daraus resultiert, dass die Koeffizienten auf der Grundlage von Stichprobendaten geschätzt werden.
Verwenden Sie den Standardfehler des Koeffizienten, um die Genauigkeit des Schätzwerts für den Koeffizienten zu ermitteln. Je kleiner der Standardfehler ist, desto genauer ist der Schätzwert. Durch Dividieren des Koeffizienten durch seinen Standardfehler wird ein t-Wert berechnet. Wenn der p-Wert dieser t-Statistik kleiner als das Signifikanzniveau (als Alpha oder α bezeichnet) ist, können Sie schlussfolgern, dass der Koeffizient statistisch signifikant ist.
Mit dem t-Wert wird das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen.
Minitab berechnet anhand des t-Werts den p-Wert, mit dem geprüft wird, ob sich der Koeffizient signifikant von 0 unterscheidet.
Anhand des t-Werts können Sie bestimmen, ob die Nullhypothese zurückgewiesen werden muss. Der p-Wert wird jedoch häufiger verwendet, da der Schwellenwert für die Zurückweisung der Nullhypothese unabhängig von den Freiheitsgraden ist. Weitere Informationen zum Verwenden des t-Werts finden Sie unter Verwenden des t-Werts, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Für eine Stabilitätsuntersuchung enthält die Koeffiziententabelle nur Terme mit p-Werten, die kleiner als das Signifikanzniveau für die Analyse sind. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist. Das standardmäßige Signifikanzniveau beträgt 0,25. Ein Signifikanzniveau von 0,25 gibt ein Risiko von 25 % an, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist.
Diese Konfidenzintervalle (KIs) sind Bereiche von Werten, die wahrscheinlich den tatsächlichen Wert des Koeffizienten für jeden Term im Modell enthalten.
Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.
Verwenden Sie das Konfidenzintervall, um den Schätzwert des Koeffizienten der Grundgesamtheit für jeden Term im Modell zu beurteilen.
Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Koeffizienten für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.
Der Varianzinflationsfaktor (VIF) zeigt, wie groß die Inflation der Varianz eines Koeffizienten aufgrund der Korrelationen unter den Prädiktoren im Modell ist.
Verwenden Sie den VIF-Wert, um zu beschreiben, welcher Grad der Multikollinearität (Korrelation zwischen Prädiktoren) in einer Regressionsanalyse vorliegt. Multikollinearität ist problematisch, da sie zu einer Zunahme der Varianz der Regressionskoeffizienten führen kann, und dies erschwert die Auswertung der individuellen Auswirkung der einzelnen korrelierenden Prädiktoren auf die Antwortvariable.
VIF | Status des Prädiktors |
---|---|
VIF = 1 | Nicht korreliert |
1 < VIF < 5 | Mäßig korreliert |
VIF > 5 | Stark korreliert |
Weitere Informationen zur Multikollinearität und zum Mindern der Auswirkungen der Multikollinearität finden Sie unter Multikollinearität bei der Regression.