Koeffiziententabelle für Binäre Antwort für Wirkungsflächenversuchsplan analysieren

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Koeffiziententabelle.

Koef

Ein Regressionskoeffizient beschreibt die Größe und Richtung der Beziehung zwischen einem Prädiktor und der Antwortvariablen. Koeffizienten sind die Zahlen, mit denen die Werte des Terms in einer Regressionsgleichung multipliziert werden.

Interpretation

Verwenden Sie den Koeffizienten, um zu ermitteln, ob eine Änderung in einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Der Koeffizient für einen Term stellt die Änderung der Linkfunktion der Antwortvariablen bei einem Anstieg des betreffenden Terms um eine kodierte Einheit dar, wenn alle übrigen Terme auf konstanten Werten gehalten werden.

Die Größe des Effekts bietet in der Regel einen guten Anhaltspunkt, um die praktische Signifikanz des Effekts eines Terms auf die Antwortvariable zu beurteilen. Die Größe des Effekts liefert keinen Hinweis darauf, ob ein Term statistisch signifikant ist, da bei den Berechnungen für die Signifikanz auch die Streuung der Daten der Antwortvariablen berücksichtigt wird. Untersuchen Sie den p-Wert für den Term, um die statistische Signifikanz zu ermitteln.

Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, u. a. von der Linkfunktion, dem Referenzereignis für die Antwortvariable und den Referenzstufen für die kategorialen Prädiktoren, die im Modell enthalten sind. Im Allgemeinen steigern positive Koeffizienten die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern. Ein geschätzter Koeffizient nahe 0 weist darauf hin, dass der Effekt des Prädiktors gering ist.

Terme, bei denen es sich nicht um Faktoren handelt, z. B. der Blockterm, weisen keine hohe und tiefe Stufe auf. Diese Terme haben keinen Effekt, jedoch einen Koeffizienten.
Blöcke
Blöcke sind kategoriale Variablen mit dem Kodierungsschema (−1, 0, +1). Jeder Koeffizient stellt die Differenz zwischen der Linkfunktion für den Block und den Durchschnittswert dar.

Interpretation für die Logit-Linkfunktion

Die Logit-Linkfunktion stellt die natürlichste Interpretation der geschätzten Koeffizienten dar; aus diesem Grund wird sie in Minitab als Standardkopplung verwendet. Bei der Interpretation wird von der Tatsache ausgegangen, dass die Chance eines Referenzereignisses P(Ereignis)/P(Nicht-Ereignis) entspricht, und angenommen, dass die anderen Prädiktoren konstant bleiben. Je größer die logarithmierte Chance, desto wahrscheinlicher ist das Referenzereignis. Positive Koeffizienten weisen daher darauf hin, dass das Ereignis wahrscheinlicher wird, und negative Koeffizienten weisen darauf hin, dass das Ereignis weniger wahrscheinlich wird. Eine Übersicht über die Interpretationen für die verschiedenen Faktortypen folgt.

Stetige Faktoren
Der Koeffizient eines stetigen Faktors entspricht der geschätzten Änderung des natürlichen Logarithmus der Chance für das Referenzereignis bei jedem Anstieg des Faktors um eine kodierte Einheit. Wenn z. B. jede kodierte Einheit eines Zeitfaktors eine Änderung um 30 Sekunden darstellt und der Koeffizient für Zeit 1,4 beträgt, erhöht sich der natürliche Logarithmus der Chance um 1,4, wenn sich die Zeit um 30 Sekunden erhöht.
Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.
Kategoriale Faktoren
Bei einem kategorialen Faktor ist der Koeffizient eines kategorialen Faktors gleich der geschätzten Änderung des natürlichen Logarithmus der Chance des Ereignisses vom Durchschnittswert. Angenommen, der Koeffizient für Stufe A eines Faktors beträgt 1,3. Bei der Faktorstufe A erhöht sich die Prognose für den natürlichen Logarithmus der Chance um 1,3 im Vergleich zum Durchschnitt für die Gleichung über den Faktor.
Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.

SE Koef

Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.

Interpretation

Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.

Konfidenzintervall für Koeffizient (95%-KI)

Diese Konfidenzintervalle (KIs) sind Bereiche von Werten, die wahrscheinlich den tatsächlichen Wert des Koeffizienten für jeden Term im Modell enthalten.

Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.

Das Konfidenzintervall setzt sich aus den folgenden zwei Teilen zusammen:
Punktschätzung
Mit diesem einzelnen Wert wird der Parameter der Grundgesamtheit unter Verwendung der Stichprobendaten geschätzt.
Fehlerspanne
Die Fehlerspanne definiert die Breite des Konfidenzintervalls, und sie wird durch die Spannweite der Ereigniswahrscheinlichkeiten, den Stichprobenumfang und das Konfidenzniveau bestimmt.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des Koeffizienten der Grundgesamtheit für jeden Term im Modell zu beurteilen.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Koeffizienten für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

z-Wert

Beim z-Wert handelt es sich um eine Teststatistik für Wald-Tests, mit der das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen wird.

Interpretation

Minitab verwendet den z-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der Wald-Test ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Stichprobenkoeffizienten einer Normalverteilung folgt.

Ein hinreichend weit von 0 entfernter z-Wert weist darauf hin, dass der Schätzwert des Koeffizienten sowohl groß als auch genau genug ist, um sich statistisch von 0 zu unterscheiden. Ein z-Wert, der nahe bei 0 liegt, weist hingegen darauf hin, dass der Schätzwert des Koeffizienten zu klein oder zu ungenau ist, um sicher sein zu können, dass der Term eine Auswirkung auf die Antwortvariable hat.

Die Tests in der Abweichungstabelle sind Likelihood-Quotienten-Tests. Die Tests in der erweiterten Anzeige der Koeffiziententabelle sind Wald-Approximationstests. Die Likelihood-Quotienten-Tests sind bei kleineren Stichproben genauer als Wald-Approximationstests.

p-Wert

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Die Tests in der Abweichungstabelle sind Likelihood-Quotienten-Tests. Die Tests in der erweiterten Anzeige der Koeffiziententabelle sind Wald-Approximationstests. Die Likelihood-Quotienten-Tests sind bei kleineren Stichproben genauer als Wald-Approximationstests.

Interpretation

Um zu bestimmen, ob sich ein Koeffizient statistisch von 0 unterscheidet, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient gleich 0 ist, was bedeutet, dass zwischen dem Term und der Antwortvariablen keine Assoziation besteht.

In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass der Koeffizient ungleich 0 ist, wenn er tatsächlich 0 ist, von 5 %.

p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Koeffizient statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
Faktoren
Wenn der Koeffizient für einen Faktor statistisch signifikant ist, können Sie schlussfolgern, dass die Wahrscheinlichkeit des Ereignisses nicht für alle Stufen des Faktors gleich ist.
Wechselwirkungen zwischen Faktoren
Wenn der Koeffizient für eine Wechselwirkung statistisch signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Faktor und der Antwortvariablen von den anderen Faktoren im Term abhängt.
Blöcke
Wenn der Koeffizient für einen Block statistisch signifikant ist, können Sie schlussfolgern, dass sich die Linkfunktion für den Block vom Durchschnittswert unterscheidet.

Interpretation für die Logit-Linkfunktion

Die Logit-Linkfunktion stellt die natürlichste Interpretation der geschätzten Koeffizienten dar; aus diesem Grund wird sie in Minitab als Standardkopplung verwendet. Bei der Interpretation wird von der Tatsache ausgegangen, dass die Chance eines Referenzereignisses P(Ereignis)/P(Nicht-Ereignis) entspricht, und angenommen, dass die anderen Prädiktoren konstant bleiben. Je größer die logarithmierte Chance, desto wahrscheinlicher ist das Referenzereignis. Positive Koeffizienten weisen daher darauf hin, dass das Ereignis wahrscheinlicher wird, und negative Koeffizienten weisen darauf hin, dass das Ereignis weniger wahrscheinlich wird. Eine Übersicht über die Interpretationen für die verschiedenen Faktortypen folgt.

Stetige Faktoren
Der Koeffizient eines stetigen Faktors entspricht der geschätzten Änderung des natürlichen Logarithmus der Chance für das Referenzereignis bei jedem Anstieg des Faktors um eine kodierte Einheit. Wenn z. B. jede kodierte Einheit eines Zeitfaktors eine Änderung um 30 Sekunden darstellt und der Koeffizient für Zeit 1,4 beträgt, erhöht sich der natürliche Logarithmus der Chance um 1,4, wenn sich die Zeit um 30 Sekunden erhöht.
Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.
Kategoriale Faktoren
Bei einem kategorialen Faktor ist der Koeffizient eines kategorialen Faktors gleich der geschätzten Änderung des natürlichen Logarithmus der Chance des Ereignisses vom Durchschnittswert. Angenommen, der Koeffizient für Stufe A eines Faktors beträgt 1,3. Bei der Faktorstufe A erhöht sich die Prognose für den natürlichen Logarithmus der Chance um 1,3 im Vergleich zum Durchschnitt für die Gleichung über den Faktor.
Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.

VIF

Der Varianzinflationsfaktor (VIF) gibt an, wie groß die Inflation der Varianz eines Koeffizienten aufgrund der Korrelationen unter den Prädiktoren im Modell ist.

Interpretation

Verwenden Sie den VIF-Wert, um zu beschreiben, welcher Grad der Multikollinearität (Korrelation zwischen Prädiktoren) in einem Modell vorliegt. In den meisten faktoriellen Versuchsplänen sind alle VIF-Werte gleich 1, was darauf hinweist, dass die Prädiktoren keine Multikollinearität aufweisen. Wenn keine Multikollinearität vorliegt, kann die statistische Signifikanz leichter ermittelt werden. Zwei gängige Gründe für ansteigende VIF-Werte, die die Interpretation der statistischen Signifikanz erschweren, sind das Einbinden von Kovariaten in das Modell und das Auftreten misslungener Durchläufe während der Datenerfassung. Für binäre Antwortvariablen sind die VIF-Werte zudem häufig größer als 1.

Interpretieren Sie den VIF anhand der folgenden Richtlinien:
VIF Status des Prädiktors
VIF = 1 Nicht korreliert
1 < VIF < 5 Mäßig korreliert
VIF > 5 Stark korreliert
Stark korrelierende Prädiktoren sind problematisch, da die Multikollinearität eine ansteigende Varianz der Regressionskoeffizienten bewirken kann. Instabile Koeffizienten können u. a. die folgenden Konsequenzen haben:
  • Die Koeffizienten sind anscheinend nicht statistisch signifikant, selbst wenn eine wichtige Beziehung zwischen dem Prädiktor und der Antwortvariablen besteht.
  • Die Koeffizienten für stark korrelierte Prädiktoren variieren erheblich von Stichprobe zu Stichprobe.
  • Das Entfernen von stark korrelierten Termen aus dem Modell hat schwerwiegende Auswirkungen auf die geschätzten Koeffizienten der anderen stark korrelierten Terme. Koeffizienten der stark korrelierten Terme können sogar die Richtung des Effekts umkehren.

Gehen Sie mit Umsicht vor, wenn Multikollinearität vorliegt und Sie anhand der statistischen Signifikanz auswählen, welche Terme aus einem Modell entfernt werden sollen. Fügen Sie dem Modell jeweils nur einen Term hinzu bzw. entfernen Sie jeweils nur einen Term aus dem Modell. Überwachen Sie beim Ändern des Modells die Änderungen in den zusammenfassenden Statistiken sowie die Tests der statistischen Signifikanz.