Koeffiziententabelle für Definitiven Screening-Versuchsplan analysieren

In diesem Thema

Koef
SE Koef
Konfidenzintervall für Koeffizient (95%-KI)
t-Wert
p-Wert – Koeffizient
VIF

Koef

Der Koeffizient beschreibt die Größe und die Richtung der Beziehung zwischen einem Term im Modell und der Antwortvariablen. Um die Multikollinearität zwischen den Termen zu minimieren, werden alle Koeffizienten in kodierten Einheiten angegeben.

Interpretation

Der Koeffizient für einen Term stellt die Änderung des Mittelwerts der Antwortvariablen bei einem Anstieg des betreffenden Terms um eine kodierte Einheit dar, wenn alle übrigen Terme auf konstanten Werten gehalten werden. Das Vorzeichen des Koeffizienten gibt die Richtung der Beziehung zwischen dem Term und der Antwortvariablen an. Die Größe des Effekts liefert keinen Hinweis darauf, ob ein Term statistisch signifikant ist, da bei den Berechnungen für die Signifikanz auch die Genauigkeit des Schätzwerts des Koeffizienten berücksichtigt wird. Untersuchen Sie den p-Wert für den Term, um die statistische Signifikanz zu ermitteln.

Für Terme, die keine Faktoren enthalten (z. B. Kovariatenterme und Blockterme), werden keine kodierten Einheiten verwendet. Diese Koeffizienten werden anders interpretiert.

Kovariaten: Der Koeffizient für eine Kovariate liegt in der gleichen Einheit wie die Kovariate vor. Der Koeffizient stellt die Änderung des prognostizierten Mittelwerts der Antwortvariablen bei einer Zunahme der Kovariaten um eine Einheit dar. Wenn der Koeffizient negativ ist, nimmt der prognostizierte Mittelwert der Antwortvariablen bei einer Zunahme der Kovariaten ab. Wenn der Koeffizient positiv ist, nimmt der prognostizierte Mittelwert der Antwortvariablen bei einer Zunahme der Kovariaten zu. Da Kovariaten nicht kodiert und im Allgemeinen nicht orthogonal zu den Faktoren sind, nehmen die VIF-Werte bei Vorhandensein von Kovariaten in der Regel zu. Weitere Informationen finden Sie im Abschnitt zum VIF.
Blöcke: Blöcke sind kategoriale Variablen mit dem (−1, 0, +1)-Kodierungsschema. Jeder Koeffizient stellt die Differenz zwischen dem Mittelwert der Antwortvariablen für den Block und dem Gesamtmittelwert der Antwortvariablen dar.

SE Koef

Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Versuchsplan und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.

Interpretation

Verwenden Sie den Standardfehler des Koeffizienten, um die Genauigkeit des Schätzwerts für den Koeffizienten zu ermitteln. Je kleiner der Standardfehler, desto genauer ist der Schätzwert. Durch Dividieren des Koeffizienten durch seinen Standardfehler wird ein t-Wert berechnet. Wenn der dieser t-Statistik entsprechende p-Wert kleiner als das Signifikanzniveau ist, schlussfolgern Sie, dass der Koeffizient statistisch signifikant ist.

Konfidenzintervall für Koeffizient (95%-KI)

Diese Konfidenzintervalle (KIs) sind Bereiche von Werten, die wahrscheinlich den tatsächlichen Wert des Koeffizienten für jeden Term im Modell enthalten.

Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.

Das Konfidenzintervall setzt sich aus den folgenden zwei Teilen zusammen:

Punktschätzung: Mit diesem einzelnen Wert wird der Parameter der Grundgesamtheit unter Verwendung der Stichprobendaten geschätzt. Das Konfidenzintervall wird um die Punktschätzung zentriert.
Fehlerspanne: Die Fehlerspanne definiert die Breite des Konfidenzintervalls, und sie wird durch die beobachtete Streuung in der Stichprobe, den Stichprobenumfang und das Konfidenzniveau bestimmt. Zum Berechnen der Obergrenze des Konfidenzintervalls wird die Fehlerspanne zur Punktschätzung addiert. Zum Berechnen der Untergrenze des Konfidenzintervalls wird die Fehlerspanne von der Punktschätzung subtrahiert.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des Koeffizienten der Grundgesamtheit für jeden Term im Modell zu beurteilen.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Koeffizienten für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

t-Wert

Mit dem t-Wert wird das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen.

Interpretation

Minitab berechnet anhand des t-Werts den p-Wert, mit dem geprüft wird, ob sich der Koeffizient signifikant von 0 unterscheidet.

Anhand des t-Werts können Sie bestimmen, ob die Nullhypothese zurückgewiesen werden muss. Der p-Wert wird jedoch häufiger verwendet, da der Schwellenwert für die Zurückweisung der Nullhypothese unabhängig von den Freiheitsgraden ist. Weitere Informationen zum Verwenden des t-Werts finden Sie unter Verwenden des t-Werts, um zu bestimmen, ob die Nullhypothese zurückzuweisen ist.

p-Wert – Koeffizient

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Interpretation

Um zu bestimmen, ob sich ein Koeffizient von 0 unterscheidet, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient gleich 0 ist, was bedeutet, dass zwischen dem Term und der Antwortvariablen keine Assoziation besteht.

In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass der Koeffizient ungleich 0 ist, während er tatsächlich 0 ist, von 5 %.

p-Wert ≤ α: Die Assoziation ist statistisch signifikant: Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant: Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, dass Modell ohne den Term erneut anzupassen.; Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.

Wenn ein Koeffizient statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:

Lineare Terme: Wenn der Koeffizient für einen linearen Term statistisch signifikant ist, können Sie schlussfolgern, dass der Koeffizient für den linearen Term ungleich 0 ist.
Wechselwirkungen zwischen Faktoren: Wenn der Koeffizient für eine Wechselwirkung statistisch signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Faktor und der Antwortvariablen von den anderen Faktoren im Term abhängt.
Quadrierte Terme: Wenn der Koeffizient für einen quadrierten Term statistisch signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen dem Faktor und der Antwortvariablen gekrümmt ist.
Kovariaten: Wenn der Koeffizient für eine Kovariate statistisch signifikant ist, können Sie schlussfolgern, dass die Assoziation zwischen der Antwortvariablen und der Kovariaten statistisch signifikant ist.
Blöcke: Wenn der Koeffizient für einen Block statistisch signifikant ist, können Sie schlussfolgern, dass sich der Mittelwert der Antwortvariablen im betreffenden Block vom Gesamtmittelwert der Antwortvariablen unterscheidet.

VIF

Der Varianzinflationsfaktor (VIF) gibt an, wie groß die Inflation der Varianz eines Koeffizienten aufgrund der Korrelationen unter den Prädiktoren im Modell ist.

Interpretation

Verwenden Sie den VIF-Wert, um zu beschreiben, welcher Grad der Multikollinearität (Korrelation zwischen Prädiktoren) in einem Modell vorliegt. Meist liegen in Modellen für Screening-Versuchspläne ausschließlich Haupteffekte vor. In diesem Fall ist der VIF-Wert gleich 1, es sei denn, es sind Kovariaten oder misslungene Durchläufe vorhanden. Partielle Aliasbeziehungen, die bei Modellen für Screening-Versuchspläne häufig auftreten, verstärken die Multikollinearität. Die Multikollinearität erschwert das Ermitteln der statistischen Signifikanz. Durch das Einbinden von Kovariaten in das Modell und das Auftreten von misslungenen Durchläufen können VIF-Werte ebenfalls zunehmen. Interpretieren Sie den VIF-Wert anhand der folgenden Richtlinien:

VIF	Status des Prädiktors
VIF = 1	Nicht korreliert
1 < VIF < 5	Mäßig korreliert
VIF > 5	Stark korreliert

Stark korrelierende Prädiktoren sind problematisch, da die Multikollinearität eine ansteigende Varianz der Regressionskoeffizienten bewirken kann. Instabile Koeffizienten können u. a. die folgenden Konsequenzen haben:

Die Koeffizienten sind anscheinend nicht statistisch signifikant, selbst wenn eine wichtige Beziehung zwischen dem Prädiktor und der Antwortvariablen besteht.
Die Koeffizienten für stark korrelierte Prädiktoren variieren erheblich von Stichprobe zu Stichprobe.
Das Entfernen von stark korrelierten Termen aus dem Modell hat schwerwiegende Auswirkungen auf die geschätzten Koeffizienten der anderen stark korrelierten Terme. Die Koeffizienten der stark korrelierten Terme können sogar ein falsches Vorzeichen aufweisen.

Gehen Sie mit Umsicht vor, wenn Multikollinearität vorliegt und Sie anhand der statistischen Signifikanz auswählen, welche Terme aus einem Modell entfernt werden sollen. Fügen Sie dem Modell jeweils nur einen Term hinzu bzw. entfernen Sie jeweils nur einen Term aus dem Modell. Überwachen Sie beim Ändern des Modells die Änderungen in den zusammenfassenden Statistiken sowie die Tests der statistischen Signifikanz.