Koeffiziententabelle für Binäre Antwort für faktoriellen Versuchsplan analysieren

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Koeffiziententabelle.

In diesem Thema

Effekt
Koef
SE Koef
Konfidenzintervall für Koeffizient (95%-KI)
z-Wert
p-Wert
VIF

Effekt

Ein Effekt beschreibt die Größe und Richtung der Beziehung zwischen einem Term und einer Antwortvariablen. Minitab berechnet Effekte für Faktoren und Wechselwirkungen zwischen Faktoren.

Interpretation

Die Effektgröße entspricht einer Änderung in der Linkfunktion. Bei Verwendung der Logit-Linkfunktion ist die Effektgröße das Log-Chancenverhältnis für den Wechsel von der tiefen auf die hohe Stufe des Faktors. Das Vorzeichen des Effekts gibt die Richtung der Beziehung zwischen dem Term und der Antwortvariablen an.

Wenn eine Wechselwirkung eine größere Anzahl von Faktoren umfasst, lässt sich der Effekt schwerer interpretieren. Für Faktoren und Wechselwirkungen zwischen Faktoren bietet die Größe des Effekts in der Regel einen guten Anhaltspunkt, um die praktische Signifikanz des Effekts zu beurteilen, den ein Term auf die Antwortvariable hat.

Die Größe des Effekts liefert keinen Hinweis darauf, ob ein Term statistisch signifikant ist, da bei den Berechnungen für die Signifikanz auch die Streuung der Daten der Antwortvariablen berücksichtigt wird. Untersuchen Sie den p-Wert für den Term, um die statistische Signifikanz zu ermitteln.

Koef

Ein Regressionskoeffizient beschreibt die Größe und Richtung der Beziehung zwischen einem Prädiktor und der Antwortvariablen. Koeffizienten sind die Zahlen, mit denen die Werte des Terms in einer Regressionsgleichung multipliziert werden.

Interpretation

Verwenden Sie den Koeffizienten, um zu ermitteln, ob eine Änderung in einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Der Koeffizient für einen Term stellt die Änderung der Linkfunktion der Antwortvariablen bei einem Anstieg des betreffenden Terms um eine kodierte Einheit dar, wenn alle übrigen Terme auf konstanten Werten gehalten werden.

Die Größe des Effekts bietet in der Regel einen guten Anhaltspunkt, um die praktische Signifikanz des Effekts eines Terms auf die Antwortvariable zu beurteilen. Die Größe des Effekts liefert keinen Hinweis darauf, ob ein Term statistisch signifikant ist, da bei den Berechnungen für die Signifikanz auch die Streuung der Daten der Antwortvariablen berücksichtigt wird. Untersuchen Sie den p-Wert für den Term, um die statistische Signifikanz zu ermitteln.

Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, u. a. von der Linkfunktion, dem Referenzereignis für die Antwortvariable und den Referenzstufen für die kategorialen Prädiktoren, die im Modell enthalten sind. Im Allgemeinen steigern positive Koeffizienten die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern. Ein geschätzter Koeffizient nahe 0 weist darauf hin, dass der Effekt des Prädiktors gering ist.

Terme, bei denen es sich nicht um Faktoren handelt, z. B. der Kovariaten-, Block- und Zentralpunktterm, weisen keine hohe und tiefe Stufe auf. Diese Terme haben keinen Effekt, jedoch einen Koeffizienten.

Kovariaten: Der Koeffizient für eine Kovariate liegt in der gleichen Einheit wie die Kovariate vor. Der Koeffizient stellt die Änderung der Linkfunktion bei einer Zunahme der Kovariaten um eine Einheit dar. Wenn der Koeffizient negativ ist, nimmt die Wahrscheinlichkeit bei einer Abnahme der Kovariaten zu. Ist der Koeffizient positiv, nimmt die Wahrscheinlichkeit bei einer Zunahme der Kovariaten ab. Da Kovariaten nicht kodiert und im Allgemeinen nicht orthogonal zu den Faktoren sind, nehmen die VIF-Werte bei einem Vorhandensein von Kovariaten in der Regel zu. Weitere Informationen finden Sie im Abschnitt zum VIF.
Blöcke: Blöcke sind kategoriale Variablen mit dem Kodierungsschema (−1, 0, +1). Jeder Koeffizient stellt die Differenz zwischen der Linkfunktion für den Block und den Durchschnittswert dar.
ZtrlPunkt: Der Zentralpunktterm ist für einen Zentralpunkt als 1 und für andere Punkte als 0 kodiert. Im Allgemeinen interpretieren Sie den Koeffizienten des Zentralpunktterms nicht, da der Term so viele quadratische Effekte in einer Aliasstruktur darstellt, wie Faktoren im Versuchsplan vorliegen. In der Regel bestimmen Sie anhand des p-Werts, ob sich eine weitere Datenerfassung lohnt, um die quadratischen Effekte der Faktoren zu schätzen.; Wenn der Koeffizient für einen Zentralpunkt statistisch signifikant ist, können Sie schlussfolgern, dass mindestens einer der Faktoren eine gekrümmte Beziehung mit der Antwortvariablen aufweist.

Interpretation für die Logit-Linkfunktion

Die Logit-Linkfunktion stellt die natürlichste Interpretation der geschätzten Koeffizienten dar; aus diesem Grund wird sie in Minitab als Standardkopplung verwendet. Bei der Interpretation wird von der Tatsache ausgegangen, dass die Chance eines Referenzereignisses P(Ereignis)/P(Nicht-Ereignis) entspricht, und angenommen, dass die anderen Prädiktoren konstant bleiben. Je größer die logarithmierte Chance, desto wahrscheinlicher ist das Referenzereignis. Positive Koeffizienten weisen daher darauf hin, dass das Ereignis wahrscheinlicher wird, und negative Koeffizienten weisen darauf hin, dass das Ereignis weniger wahrscheinlich wird. Eine Übersicht über die Interpretationen für die verschiedenen Faktortypen folgt.

Stetige Faktoren: Der Koeffizient eines stetigen Faktors entspricht der geschätzten Änderung des natürlichen Logarithmus der Chance für das Referenzereignis bei jedem Anstieg des Faktors um eine kodierte Einheit. Wenn z. B. jede kodierte Einheit eines Zeitfaktors eine Änderung um 30 Sekunden darstellt und der Koeffizient für Zeit 1,4 beträgt, erhöht sich der natürliche Logarithmus der Chance um 1,4, wenn sich die Zeit um 30 Sekunden erhöht.; Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.
Kategoriale Faktoren: Bei einem zweistufigen Faktor kann die Interpretation des Koeffizienten für einen kategorialen Faktor zwischen den zwei Stufen liegen. Der Koeffizient eines kategorialen Faktors ist die geschätzte Änderung des natürlichen Logarithmus der Chance des Ereignisses bei einer Änderung um eine kodierte Einheit. Die Differenz zwischen der tiefen und der hohen Stufe eines kategorialen Faktors beträgt 2 kodierte Einheiten. Angenommen, eine kategoriale Variable weist die Stufen „Schnell“ und „Langsam“ auf. „Langsam“ ist die tiefe Stufe, kodiert als -1. „Schnell“ ist die hohe Stufe, kodiert als +1. Wenn der Koeffizient für die Variable 1,3 beträgt, erhöht sich der natürliche Logarithmus der Chance für das Ereignis bei einer Änderung von „Langsam“ auf „Schnell“ um 2,6.; Bei einem kategorialen Faktor mit mehr als zwei Stufen ist der Koeffizient eines kategorialen Faktors gleich der geschätzten Änderung des natürlichen Logarithmus der Chance des Ereignisses vom Durchschnittswert. Angenommen, der Koeffizient für Stufe A eines Faktors beträgt 1,3. Bei der Faktorstufe A erhöht sich die Prognose für den natürlichen Logarithmus der Chance um 1,3 im Vergleich zum Durchschnitt für die Gleichung über den Faktor.; Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.

SE Koef

Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.

Interpretation

Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.

Konfidenzintervall für Koeffizient (95%-KI)

Diese Konfidenzintervalle (KIs) sind Bereiche von Werten, die wahrscheinlich den tatsächlichen Wert des Koeffizienten für jeden Term im Modell enthalten.

Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.

Das Konfidenzintervall setzt sich aus den folgenden zwei Teilen zusammen:

Punktschätzung: Mit diesem einzelnen Wert wird der Parameter der Grundgesamtheit unter Verwendung der Stichprobendaten geschätzt.
Fehlerspanne: Die Fehlerspanne definiert die Breite des Konfidenzintervalls, und sie wird durch die Spannweite der Ereigniswahrscheinlichkeiten, den Stichprobenumfang und das Konfidenzniveau bestimmt.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des Koeffizienten der Grundgesamtheit für jeden Term im Modell zu beurteilen.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Koeffizienten für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

z-Wert

Beim z-Wert handelt es sich um eine Teststatistik für Wald-Tests, mit der das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen wird.

Interpretation

Minitab verwendet den z-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der Wald-Test ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Stichprobenkoeffizienten einer Normalverteilung folgt.

Ein hinreichend weit von 0 entfernter z-Wert weist darauf hin, dass der Schätzwert des Koeffizienten sowohl groß als auch genau genug ist, um sich statistisch von 0 zu unterscheiden. Ein z-Wert, der nahe bei 0 liegt, weist hingegen darauf hin, dass der Schätzwert des Koeffizienten zu klein oder zu ungenau ist, um sicher sein zu können, dass der Term eine Auswirkung auf die Antwortvariable hat.

Die Tests in der Abweichungstabelle sind Likelihood-Quotienten-Tests. Die Tests in der erweiterten Anzeige der Koeffiziententabelle sind Wald-Approximationstests. Die Likelihood-Quotienten-Tests sind bei kleineren Stichproben genauer als Wald-Approximationstests.

p-Wert

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Interpretation

Um zu bestimmen, ob sich ein Koeffizient statistisch von 0 unterscheidet, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient gleich 0 ist, was bedeutet, dass zwischen dem Term und der Antwortvariablen keine Assoziation besteht.

In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko der Schlussfolgerung, dass der Koeffizient ungleich 0 ist, während er tatsächlich 0 ist, von 5 %.

p-Wert ≤ α: Die Assoziation ist statistisch signifikant: Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant: Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.; Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.

Wenn ein Koeffizient statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:

Faktoren: Wenn der Koeffizient für einen Faktor signifikant ist, können Sie schlussfolgern, dass die Wahrscheinlichkeit des Ereignisses nicht für alle Stufen des Faktors gleich ist.
Wechselwirkungen zwischen Faktoren: Wenn der Koeffizient für eine Wechselwirkung statistisch signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Faktor und der Antwortvariablen von den anderen Faktoren im Term abhängt.
Kovariaten: Wenn der Koeffizient für eine Kovariate statistisch signifikant ist, können Sie schlussfolgern, dass die Assoziation zwischen der Antwortvariablen und der Kovariaten statistisch signifikant ist.
Blöcke: Wenn der Koeffizient für einen Block statistisch signifikant ist, können Sie schlussfolgern, dass sich die Linkfunktion für den Block vom Durchschnittswert unterscheidet.
ZtrlPunkt: Wenn der Koeffizient für einen Zentralpunkt statistisch signifikant ist, können Sie schlussfolgern, dass mindestens einer der Faktoren eine gekrümmte Beziehung mit der Antwortvariablen aufweist. Es empfiehlt sich, dem Versuchsplan Sternpunkte hinzuzufügen, um auf diese Weise die Krümmung zu modellieren.

Interpretation für die Logit-Linkfunktion

Stetige Faktoren: Der Koeffizient eines stetigen Faktors entspricht der geschätzten Änderung des natürlichen Logarithmus der Chance für das Referenzereignis bei jedem Anstieg des Faktors um eine kodierte Einheit. Wenn z. B. jede kodierte Einheit eines Zeitfaktors eine Änderung um 30 Sekunden darstellt und der Koeffizient für Zeit 1,4 beträgt, erhöht sich der natürliche Logarithmus der Chance um 1,4, wenn sich die Zeit um 30 Sekunden erhöht.; Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.
Kategoriale Faktoren: Bei einem zweistufigen Faktor kann die Interpretation des Koeffizienten für einen kategorialen Faktor zwischen den zwei Stufen liegen. Der Koeffizient eines kategorialen Faktors ist die geschätzte Änderung des natürlichen Logarithmus der Chance des Ereignisses bei einer Änderung um eine kodierte Einheit. Die Differenz zwischen der tiefen und der hohen Stufe eines kategorialen Faktors beträgt 2 kodierte Einheiten. Angenommen, eine kategoriale Variable weist die Stufen „Schnell“ und „Langsam“ auf. „Langsam“ ist die tiefe Stufe, kodiert als -1. „Schnell“ ist die hohe Stufe, kodiert als +1. Wenn der Koeffizient für die Variable 1,3 beträgt, erhöht sich der natürliche Logarithmus der Chance für das Ereignis bei einer Änderung von „Langsam“ auf „Schnell“ um 2,6.; Bei einem kategorialen Faktor mit mehr als zwei Stufen ist der Koeffizient eines kategorialen Faktors gleich der geschätzten Änderung des natürlichen Logarithmus der Chance des Ereignisses vom Durchschnittswert. Angenommen, der Koeffizient für Stufe A eines Faktors beträgt 1,3. Bei der Faktorstufe A erhöht sich die Prognose für den natürlichen Logarithmus der Chance um 1,3 im Vergleich zum Durchschnitt für die Gleichung über den Faktor.; Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden.

VIF

Der Varianzinflationsfaktor (VIF) gibt an, wie groß die Inflation der Varianz eines Koeffizienten aufgrund der Korrelationen unter den Prädiktoren im Modell ist.

Interpretation

Verwenden Sie den VIF-Wert, um zu beschreiben, welcher Grad der Multikollinearität (Korrelation zwischen Prädiktoren) in einem Modell vorliegt. In den meisten faktoriellen Versuchsplänen sind alle VIF-Werte gleich 1, was darauf hinweist, dass die Prädiktoren keine Multikollinearität aufweisen. Wenn keine Multikollinearität vorliegt, kann die statistische Signifikanz leichter ermittelt werden. Zwei gängige Gründe für ansteigende VIF-Werte, die die Interpretation der statistischen Signifikanz erschweren, sind das Einbinden von Kovariaten in das Modell und das Auftreten misslungener Durchläufe während der Datenerfassung. Für binäre Antwortvariablen sind die VIF-Werte zudem häufig größer als 1.

Interpretieren Sie den VIF anhand der folgenden Richtlinien:

VIF	Status des Prädiktors
VIF = 1	Nicht korreliert
1 < VIF < 5	Mäßig korreliert
VIF > 5	Stark korreliert

Stark korrelierende Prädiktoren sind problematisch, da die Multikollinearität eine ansteigende Varianz der Regressionskoeffizienten bewirken kann. Instabile Koeffizienten können u. a. die folgenden Konsequenzen haben:

Die Koeffizienten sind anscheinend nicht statistisch signifikant, selbst wenn eine wichtige Beziehung zwischen dem Prädiktor und der Antwortvariablen besteht.
Die Koeffizienten für stark korrelierte Prädiktoren variieren erheblich von Stichprobe zu Stichprobe.
Das Entfernen von stark korrelierten Termen aus dem Modell hat schwerwiegende Auswirkungen auf die geschätzten Koeffizienten der anderen stark korrelierten Terme. Koeffizienten der stark korrelierten Terme können sogar die Richtung des Effekts umkehren.

Gehen Sie mit Umsicht vor, wenn Multikollinearität vorliegt und Sie anhand der statistischen Signifikanz auswählen, welche Terme aus einem Modell entfernt werden sollen. Fügen Sie dem Modell jeweils nur einen Term hinzu bzw. entfernen Sie jeweils nur einen Term aus dem Modell. Überwachen Sie beim Ändern des Modells die Änderungen in den zusammenfassenden Statistiken sowie die Tests der statistischen Signifikanz.