Koeffizienten für Poisson-Modell anpassen

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Koeffiziententabelle.

Koef

Ein Regressionskoeffizient beschreibt die Größe und Richtung der Beziehung zwischen einem Prädiktor und der Antwortvariablen. Koeffizienten sind die Zahlen, mit denen die Werte des Terms in einer Regressionsgleichung multipliziert werden.

Interpretation

Verwenden Sie den Koeffizienten, um zu ermitteln, ob eine Änderung in einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Der geschätzte Koeffizient für einen Prädiktor stellt die Änderung in der Linkfunktion bei einer Änderung des Prädiktors um eine Einheit dar, wenn die anderen Prädiktoren im Modell auf konstanten Werten gehalten werden. Die Beziehung zwischen dem Koeffizienten und der Anzahl der Ereignisse hängt von verschiedenen Aspekten der Analyse ab, u. a. von der Linkfunktion und den Referenzstufen für kategoriale Prädiktoren im Modell. Im Allgemeinen steigern positive Koeffizienten die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern. Ein geschätzter Koeffizient nahe null weist darauf hin, dass der Effekt des Prädiktors klein oder nicht vorhanden ist.

Die Interpretation der geschätzten Koeffizienten für die kategorialen Prädiktoren bezieht sich auf die Referenzstufe des Prädiktors. Positive Koeffizienten weisen darauf hin, dass das Ereignis auf dieser Stufe des Prädiktors wahrscheinlicher als auf der Referenzstufe des Faktors ist. Negative Koeffizienten weisen darauf hin, dass das Ereignis auf dieser Stufe des Prädiktors weniger wahrscheinlich als auf der Referenzstufe ist.

SE Koef

Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.

Interpretation

Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.

Konfidenzintervall für Koeffizienten (95%-KI)

Diese Konfidenzintervalle (KIs) sind Bereiche von Werten, die wahrscheinlich den tatsächlichen Wert des Koeffizienten für jeden Term im Modell enthalten. Bei der Berechnung der Konfidenzintervalle wird die Normalverteilung verwendet. Das Konfidenzintervall ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Stichprobenkoeffizienten einer Normalverteilung folgt.

Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.

Das Konfidenzintervall setzt sich aus den folgenden zwei Teilen zusammen:
Punktschätzung
Mit diesem einzelnen Wert wird der Parameter der Grundgesamtheit unter Verwendung der Stichprobendaten geschätzt. Das Konfidenzintervall wird um die Punktschätzung zentriert.
Fehlerspanne
Die Fehlerspanne definiert die Breite des Konfidenzintervalls, und sie wird durch die beobachtete Streuung in der Stichprobe, den Stichprobenumfang und das Konfidenzniveau bestimmt. Zum Berechnen der Obergrenze des Konfidenzintervalls wird die Fehlerspanne zur Punktschätzung addiert. Zum Berechnen der Untergrenze des Konfidenzintervalls wird die Fehlerspanne von der Punktschätzung subtrahiert.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des Koeffizienten der Grundgesamtheit für jeden Term im Modell zu beurteilen.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Koeffizienten für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

z-Wert

Beim z-Wert handelt es sich um eine Teststatistik für Wald-Tests, mit der das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen wird.

Interpretation

Minitab verwendet den z-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der Wald-Test ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Stichprobenkoeffizienten einer Normalverteilung folgt.

Ein hinreichend weit von 0 entfernter z-Wert weist darauf hin, dass der Schätzwert des Koeffizienten sowohl groß als auch genau genug ist, um sich statistisch von 0 zu unterscheiden. Ein z-Wert, der nahe bei 0 liegt, weist hingegen darauf hin, dass der Schätzwert des Koeffizienten zu klein oder zu ungenau ist, um sicher sein zu können, dass der Term eine Auswirkung auf die Antwortvariable hat.

Die Tests in der Abweichungstabelle sind Likelihood-Quotienten-Tests. Die Tests in der erweiterten Anzeige der Koeffiziententabelle sind Wald-Approximationstests. Die Likelihood-Quotienten-Tests sind bei kleineren Stichproben genauer als Wald-Approximationstests.

p-Wert

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Die Tests in der Abweichungstabelle sind Likelihood-Quotienten-Tests. Die Tests in der erweiterten Anzeige der Koeffiziententabelle sind Wald-Approximationstests. Die Likelihood-Quotienten-Tests sind bei kleineren Stichproben genauer als Wald-Approximationstests.

Interpretation

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist, was bedeutet, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, dass Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein stetiger Prädiktor signifikant ist, können Sie schlussfolgern, dass der Koeffizient für den Prädiktor ungleich null ist.
  • Wenn ein kategorialer Prädiktor signifikant ist, hängt die Schlussfolgerung von der Kodierung der kategorialen Variablen ab. Bei der (0;1)-Kodierung können Sie schlussfolgern, dass die mittlere Anzahl der Ereignisse für diese Stufe von der mittleren Anzahl der Ereignisse für die Referenzstufe abweicht. Bei der (-1;0;+1)-Kodierung können Sie schlussfolgern, dass die mittlere Anzahl der Ereignisse für diese Stufe von der mittleren Anzahl der Ereignisse in den Basisdaten abweicht.
  • Sie können schlussfolgern, dass nicht alle Stufen dieselbe mittlere Anzahl von Ereignissen aufweisen.
  • Wenn ein Wechselwirkungsterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen dem Prädiktor und der Anzahl von Ereignissen von den anderen Prädiktoren im Term abhängt.
  • Wenn ein Polynomialterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Anzahl von Ereignissen vom Absolutwert des Prädiktors abhängt.

VIF

Der Varianzinflationsfaktor (VIF) zeigt, wie groß die Inflation der Varianz eines Koeffizienten aufgrund der Korrelationen unter den Prädiktoren im Modell ist.

Interpretation

Verwenden Sie den VIF-Wert, um zu beschreiben, welcher Grad der Multikollinearität (Korrelation zwischen Prädiktoren) in einer Regressionsanalyse vorliegt. Multikollinearität ist problematisch, da sie zu einer Zunahme der Varianz der Regressionskoeffizienten führen kann, und dies erschwert die Auswertung der individuellen Auswirkung der einzelnen korrelierenden Prädiktoren auf die Antwortvariable.

Interpretieren Sie den VIF anhand der folgenden Richtlinien:
VIF Status des Prädiktors
VIF = 1 Nicht korreliert
1 < VIF < 5 Mäßig korreliert
VIF > 5 Stark korreliert
Ein VIF-Wert über 5 weist darauf hin, dass der Regressionskoeffizient aufgrund starker Multikollinearität ungenau geschätzt wurde.

Weitere Informationen zur Multikollinearität und zum Mindern der Auswirkungen der Multikollinearität finden Sie unter Multikollinearität bei der Regression.

Kodierte Koeffizienten

Wenn Sie die stetigen Variablen standardisieren, stellen die Koeffizienten eine Änderung bei den standardisierten Variablen um eine Einheit dar. In der Regel werden die stetigen Prädiktoren standardisiert, um die Multikollinearität zu reduzieren oder eine gemeinsame Skala für die Variablen festzulegen.

Interpretation

Die Verwendung der kodierten Koeffizienten hängt von der Standardisierungsmethode ab. Die genaue Interpretation der Koeffizienten hängt zudem von Aspekten der Analyse ab, z. B. der Linkfunktion. Positive Koeffizienten erhöhen die Wahrscheinlichkeit des Ereignisses. Negative Koeffizienten verringern die Wahrscheinlichkeit des Ereignisses. Ein geschätzter Koeffizient nahe 0 deutet darauf hin, dass der Effekt des Prädiktors klein ist.

Kodierung von -1 bzw. +1 für tiefe bzw. hohe Stufe festlegen

Jeder Koeffizient stellt die erwartete Änderung des Mittelwerts der transformierten Antwortvariablen bei einer Änderung des Prädiktors um eine Einheit auf der kodierten Skala dar.

In einem Modell werden beispielsweise die Temperatur in Grad Celsius und die Zeit in Sekunden angegeben. Bei der Temperatur entspricht 0 aufgrund der Kodierung 50 Grad Celsius, und 1 entspricht 100 Grad Celsius. Bei der Zeit entspricht 0 aufgrund der Kodierung 30 Sekunden, und 1 entspricht 60 Sekunden. Der Koeffizient für die Temperatur entspricht einer Erhöhung um 50 Grad Celsius. Der Koeffizient für die Zeit entspricht einer Erhöhung um 30 Sekunden.

Mittelwert subtrahieren, dann durch Standardabweichung dividieren

Jeder Koeffizient stellt die erwartete Änderung des Mittelwerts der transformierten Antwortvariablen bei einer Änderung der Prädiktorvariablen um eine Standardabweichung dar.

In einem Modell werden beispielsweise die Temperatur in Grad Celsius und die Zeit in Sekunden angegeben. Die Standardabweichung der Temperatur beträgt 3,7 Grad Celsius. Die Standardabweichung der Zeit beträgt 18,3 Sekunden. Der Koeffizient für die Temperatur entspricht einer Erhöhung um 3,7 Grad Celsius. Der Koeffizient für die Zeit entspricht einer Erhöhung um 18,3 Sekunden.

Mittelwert subtrahieren

Jeder Koeffizient stellt die erwartete Änderung des Mittelwerts der transformierten Antwortvariablen bei einer Änderung des Prädiktors um 1 dar.

In einem Modell werden beispielsweise die Temperatur in Grad Celsius und die Zeit in Sekunden angegeben. Der Koeffizient für die Temperatur entspricht einer Erhöhung um 1 Grad Celsius. Der Koeffizient für die Zeit entspricht einer Erhöhung um 1 Sekunde.

Durch Standardabweichung dividieren

Jeder Koeffizient stellt die erwartete Änderung des Mittelwerts der transformierten Antwortvariablen bei einer Änderung der Prädiktorvariablen um eine Standardabweichung dar.

In einem Modell werden beispielsweise die Temperatur in Grad Celsius und die Zeit in Sekunden angegeben. Die Standardabweichung der Temperatur beträgt 3,7 Grad Celsius. Die Standardabweichung der Zeit beträgt 18,3 Sekunden. Der Koeffizient für die Temperatur entspricht einer Erhöhung um 3,7 Grad Celsius. Der Koeffizient für die Zeit entspricht einer Erhöhung um 18,3 Sekunden.

Angegebenen Wert subtrahieren, dann durch einen weiteren Wert dividieren

Jeder Koeffizient stellt die erwartete Änderung des Mittelwerts der transformierten Antwortvariablen bei einer Änderung der Prädiktorvariablen um den Teiler dar.

In einem Modell werden beispielsweise die Länge in Meter und die Stromstärke in Ampere angegeben. Der Teiler beträgt 1000. Der Koeffizient für die Länge stellt eine Erhöhung um 1 Millimeter dar. Der Koeffizient für die Stromstärke stellt eine Erhöhung um 1 Milliampere dar.

Interpretation für die Logit-Linkfunktion

Die Logit-Linkfunktion stellt die natürlichste Interpretation der geschätzten Koeffizienten dar. Aus diesem Grund wird sie in Minitab als Standard-Linkfunktion verwendet. Für die Logit-Linkfunktion ist die transformierte Antwortvariable der natürliche Logarithmus der Chance für das Ereignis. Im Folgenden finden Sie eine Zusammenfassung der Interpretationen für die verschiedenen Standardisierungsmethoden.
Kodierung von -1 bzw. +1 für tiefe bzw. hohe Stufe festlegen

Jeder Koeffizient stellt die erwartete Änderung des Mittelwerts der transformierten Antwortvariablen bei einer Änderung des Prädiktors um eine Einheit auf der kodierten Skala dar.

In einem Modell wird beispielsweise die Temperatur in Grad Celsius angegeben. Aufgrund der Kodierung entspricht 0 gleich 50 Grad Celsius, und 1 entspricht 100 Grad Celsius. Der Koeffizient für die Temperatur entspricht einer Erhöhung um 50 Grad Celsius. Der Koeffizient für die Temperatur beträgt 1,8. Wenn sich die Temperatur um eine kodierte Einheit erhöht, steigt die Temperatur um 50 Grad, und der natürliche Logarithmus der Chance erhöht sich um 1,8.

Mittelwert subtrahieren, dann durch Standardabweichung dividieren

Jeder Koeffizient stellt die erwartete Änderung des natürlichen Logarithmus der Chance des Ereignisses bei einer Änderung der Prädiktorvariablen um eine Standardabweichung dar.

In einem Modell wird beispielsweise die Temperatur in Grad Celsius angegeben. Die Standardabweichung der Temperatur beträgt 3,7 Grad Celsius. Der Koeffizient für die Temperatur beträgt 1,4. Wenn sich die Temperatur um eine kodierte Einheit erhöht, steigt die Temperatur um 3,7 Grad Celsius, und der natürliche Logarithmus der Chance erhöht sich um 1,4.

Mittelwert subtrahieren

Jeder Koeffizient stellt die erwartete Änderung des natürlichen Logarithmus der Chance des Ereignisses bei einer Änderung des Prädiktors um 1 dar.

In einem Modell wird beispielsweise die Temperatur in Grad Celsius angegeben. Der Koeffizient für die Temperatur entspricht einer Erhöhung um 1 Grad Celsius. Der Koeffizient für die Temperatur beträgt 2,3. Wenn sich die Temperatur um eine kodierte Einheit erhöht, steigt die Temperatur um 1 Grad Celsius, und der natürliche Logarithmus der Chance erhöht sich um 2,3.

Durch Standardabweichung dividieren

Jeder Koeffizient stellt die erwartete Änderung des natürlichen Logarithmus der Chance des Ereignisses bei einer Änderung der Prädiktorvariablen um eine Standardabweichung dar.

In einem Modell wird beispielsweise die Temperatur in Grad Celsius angegeben. Die Standardabweichung der Temperatur beträgt 3,7 Grad Celsius. Der Koeffizient für die Temperatur beträgt 1,4. Wenn sich die Temperatur um eine kodierte Einheit erhöht, steigt die Temperatur um 3,7 Grad Celsius, und der natürliche Logarithmus der Chance erhöht sich um 1,4.

Angegebenen Wert subtrahieren, dann durch einen weiteren Wert dividieren

Jeder Koeffizient stellt die erwartete Änderung des natürlichen Logarithmus der Chance des Ereignisses bei einer Änderung der Prädiktorvariablen um den Teiler dar.

In einem Modell werden beispielsweise die Länge in Meter und die Stromstärke in Ampere angegeben. Der Teiler beträgt 1000. Der Koeffizient für die Länge stellt eine Erhöhung um 1 Millimeter dar. Der Koeffizient für die Länge beträgt 5,6. Wenn sich die Länge um eine kodierte Einheit erhöht, vergrößert sich die Länge um 1 Millimeter, und der natürliche Logarithmus der Chance erhöht sich um 5,6. Der Koeffizient für die Stromstärke stellt eine Erhöhung um 1 Milliampere dar.

Regressionsgleichung

Für die Poisson-Regression zeigt Minitab zwei Arten von Regressionsgleichungen an. Die erste Gleichung stellt die Anzahl der Ereignisse in Beziehung mit der transformierten Antwortvariablen. Die Form der ersten Gleichung hängt von der Linkfunktion ab.

Die zweite Gleichung stellt die Prädiktoren in Beziehung mit der transformierten Antwortvariablen. Wenn das Modell sowohl stetige als auch kategoriale Prädiktoren enthält, kann die zweite Gleichung für jede Kombination von Kategorien getrennt werden. Weitere Informationen zur Auswahl der Anzahl der anzuzeigenden Gleichungen finden Sie unter Auswählen der anzuzeigenden Ergebnisse für Poisson-Modell anpassen.

Interpretation

Verwenden Sie die Gleichungen, um die Beziehung zwischen der Antwortvariablen und den Prädiktorvariablen zu untersuchen.

Ein Modell für die Prognose, ob ein Harzteil einen Fehler aufweist, enthält beispielsweise die folgenden Terme:
  • Schraubengröße
  • Temperatur

Die erste Gleichung zeigt die Beziehung zwischen der Anzahl der Ereignisse und der transformierten Antwortvariablen aufgrund der Linkfunktion des natürlichen Logarithmus.

Die zweite Gleichung zeigt, in welcher Beziehung die Schraubengröße und die Temperatur zur transformierten Antwortvariable stehen. Bei einer großen Schraubengröße ist der Koeffizient für die Temperatur ungefähr −0,003. Bei einer kleinen Schraubengröße ist der Koeffizient ungefähr −0,0005. Bei diesen Gleichungen gilt: Je höher die Temperatur, desto weniger Fehler treten auf. Die Temperatur hat jedoch einen stärkeren Effekt auf die Anzahl der Fehler, wenn die Schraubengröße groß ist.

Regressionsgleichung

Verfärbungsfehler=exp(Y')
Schraubengröße
großY'=4,649 - 0,003285 Temperatur
       
kleinY'=4,105 - 0,000481 Temperatur

Wenn das Modell nicht hierarchisch ist und Sie die stetigen Prädiktoren standardisiert haben, liegt die Regressionsgleichung in kodierten Einheiten vor. Weitere Informationen finden Sie im Abschnitt zu kodierten Koeffizienten. Weitere Informationen zur Hierarchie finden Sie unter Was sind hierarchische Modelle?.