Ein Regressionskoeffizient beschreibt die Größe und Richtung der Beziehung zwischen einem Prädiktor und der Antwortvariablen. Koeffizienten sind die Zahlen, mit denen die Werte des Terms in einer Regressionsgleichung multipliziert werden.
Verwenden Sie den Koeffizienten, um zu ermitteln, ob eine Änderung in einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Der geschätzte Koeffizient für einen Prädiktor stellt die Änderung in der Linkfunktion bei einer Änderung des Prädiktors um eine Einheit dar, wenn die anderen Prädiktoren im Modell auf konstanten Werten gehalten werden. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit hängt von verschiedenen Aspekten der Analyse ab, u. a. von der Linkfunktion, dem Referenzereignis für die Antwortvariable und den Referenzstufen für die kategorialen Prädiktoren, die im Modell enthalten sind. Im Allgemeinen steigern positive Koeffizienten die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern. Ein geschätzter Koeffizient nahe 0 weist darauf hin, dass der Effekt des Prädiktors gering ist.
Die Logit-Linkfunktion stellt die natürlichste Interpretation der geschätzten Koeffizienten dar; aus diesem Grund wird sie in Minitab als Standardkopplung verwendet. Bei der Interpretation wird von der Tatsache ausgegangen, dass die Chance eines Referenzereignisses P(Ereignis)/P(Nicht-Ereignis) entspricht, und angenommen, dass die anderen Prädiktoren konstant bleiben. Je größer die logarithmierten Chance, desto wahrscheinlicher ist das Referenzereignis. Positive Koeffizienten weisen daher darauf hin, dass das Ereignis wahrscheinlicher wird, und negative Koeffizienten weisen darauf hin, dass das Ereignis weniger wahrscheinlich wird. Eine Übersicht über die Interpretationen für die verschiedenen Prädiktortypen folgt.
Der Koeffizient eines stetigen Prädiktors entspricht der geschätzten Änderung des natürlichen Logarithmus der Chance für das Referenzereignis bei jedem Anstieg des Prädiktors um eine Einheit. Wenn z. B. der Koeffizient für Zeit in Sekunden 1,4 beträgt, erhöht sich der natürliche Logarithmus der Chance mit jeder weiteren Sekunde um 1,4.
Geschätzte Koeffizienten können auch für die Berechnung des Chancenverhältnisses (des Verhältnisses zwischen zwei Chancen) verwendet werden. Um das Chancenverhältnis zu berechnen, potenzieren Sie den Koeffizienten für einen Prädiktor. Das Ergebnis ist das Chancenverhältnis für den Prädiktor = x+1 im Vergleich zu dem Prädiktor = x. Wenn z. B. das Chancenverhältnis für Masse in Kilogramm 0,95 beträgt, steigt die Wahrscheinlichkeit des Ereignisses mit jedem weiteren Kilogramm um ca. 5 %.
Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.
Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.
Mit dem Varianzinflationsfaktor (VIF) wird die Zunahme der Varianz eines Koeffizienten aufgrund von Multikollinearität angegeben.
Verwenden Sie den VIF, um zu beschreiben, wie viel Multikollinearität in einer Regressionsanalyse vorliegt. Multikollinearität ist problematisch, da sie zu einer Zunahme der Varianz der Regressionskoeffizienten führen kann, und dies erschwert die Auswertung der individuellen Auswirkung der einzelnen Prädiktoren auf die Antwortvariable.
VIF | Multikollinearität |
---|---|
VIF = 1 | Keine |
1 < VIF < 5 | Mittelmäßig |
VIF > 5 | Hoch |
Weitere Informationen zur Multikollinearität und zum Mindern der Auswirkungen der Multikollinearität finden Sie unter Multikollinearität bei der Regression.
Für die binäre logistische Regression zeigt Minitab zwei Arten von Regressionsgleichung an. Bei der ersten Gleichung wird die Wahrscheinlichkeit des Ereignisses mit der transformierten Antwortvariablen in Beziehung gesetzt. Die Form der ersten Gleichung hängt von der Linkfunktion ab. Die zweite Gleichung stellt die Prädiktoren in Beziehung mit der transformierten Antwortvariablen.
Verwenden Sie die Gleichungen, um die Beziehung zwischen der Antwortvariablen und den Prädiktorvariablen zu untersuchen.
In einem Modell wird z. B. anhand der Dosis eines Medikaments die Wahrscheinlichkeit des Ereignisses prognostiziert, dass ein bestimmter Bakterientyp bei einem Patienten abwesend ist. Die erste Gleichung zeigt die Beziehung zwischen der Wahrscheinlichkeit und der transformierten Antwortvariablen auf der Grundlage der Logit-Linkfunktion. Die zweite Gleichung zeigt, in welcher Beziehung die Dosis zur transformierten Antwortvariablen steht. Da der Koeffizient für die Dosis positiv ist, ist die Wahrscheinlichkeit für das Vorhandensein der Bakterien geringer, wenn die Dosis höher ist.
p(Keine Bakterien) | = | exp(Y')/(1 + exp(Y')) |
---|
Y' | = | -5,25 + 3,63 Dosis (mg) |
---|
Chancenverhältnis | 95%-KI | |
---|---|---|
Dosis (mg) | 37,5511 | (2,9647; 475,6190) |
Mit dem Chancenverhältnis werden die Chancen von zwei Ereignissen verglichen. Die Chancen eines Ereignisses entsprechen der Wahrscheinlichkeit, dass das Ereignis eintritt, geteilt durch die Wahrscheinlichkeit, dass das Ereignis nicht eintritt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.
Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Ereignis mit umso größerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Ereignis mit umso geringerer Wahrscheinlichkeit eintritt, je größer der Prädiktor ist.
In diesen Ergebnissen wird mit dem Modell anhand der Dosierung eines Medikaments das Vorhandensein bzw. Nichtvorhandensein von Bakterien bei erwachsenen Patienten prognostiziert. Jede Tablette enthält eine Dosierung von 0,5 mg, so dass die Forscher die Einheit für eine Änderung auf 0,5 mg festlegen. Das Chancenverhältnis beläuft sich auf etwa 6. Bei jeder weiteren Tablette, die einem Patienten verabreicht wird, steigt die Chance, dass die Bakterien beim Patienten nicht festzustellen sind, um das etwa Sechsfache.
Änderungseinheit | Chancenverhältnis | 95%-KI | |
---|---|---|---|
Dosis (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |