Interpretieren der wichtigsten Ergebnisse für Poisson-Modell anpassen

Führen Sie die folgenden Schritte aus, um ein Poisson-Regressionsmodel zu interpretieren. Zu den wichtigsten Ausgaben zählen der p-Wert, die Koeffizienten, Statistiken zur Zusammenfassung des Modells und die Residuendiagramme.

Schritt 1: Bestimmen, ob die Assoziation zwischen der Antwortvariablen und dem Term statistisch signifikant ist

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, das Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein stetiger Prädiktor signifikant ist, können Sie schlussfolgern, dass sich der Koeffizient für den Prädiktor von null unterscheidet.
  • Wenn ein kategorialer Prädiktor signifikant ist, können Sie schlussfolgern, dass nicht alle Stufen die gleiche mittlere Anzahl von Ereignissen aufweisen.
  • Wenn ein Wechselwirkungsterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen dem Prädiktor und der Anzahl der Ereignisse von den anderen Prädiktoren im Term abhängt.
  • Wenn ein Polynomialterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und der Anzahl der Ereignisse von der Größe des Prädiktors abhängt.

Varianzanalyse



Wald-Test
QuelleDFChi-Quadratp-Wert
Regression356,290,000
  Stunden seit Reinigung14,740,029
  Temperatur138,460,000
  Schraubengröße113,090,000

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante4,39820,062870,020,000 
Stunden seit Reinigung0,017980,008262,180,0291,00
Temperatur-0,0019740,000318-6,200,0001,00
Schraubengröße         
  klein-0,15460,0427-3,620,0001,00
Wichtigste Ergebnisse: p-Wert, Koeffizienten

In diesen Ergebnissen sind alle drei Prädiktoren auf dem Niveau 0,05 statistisch signifikant. Sie können schlussfolgern, dass zwischen Änderungen dieser Variablen und Änderungen der Antwortvariablen eine Assoziation besteht.

Verwenden Sie den Koeffizienten, um zu ermitteln, ob eine Änderung in einer Prädiktorvariablen die Wahrscheinlichkeit des Ereignisses vergrößert oder verringert. Der geschätzte Koeffizient für einen Prädiktor stellt die Änderung in der Linkfunktion bei einer Änderung des Prädiktors um eine Einheit dar, wenn die anderen Prädiktoren im Modell auf konstanten Werten gehalten werden. Die Beziehung zwischen dem Koeffizienten und der Anzahl der Ereignisse hängt von verschiedenen Aspekten der Analyse ab, u. a. von der Linkfunktion und den Referenzstufen für kategoriale Prädiktoren im Modell. Im Allgemeinen steigern positive Koeffizienten die Wahrscheinlichkeit des Ereignisses, während negative Koeffizienten die Wahrscheinlichkeit des Ereignisses verringern. Ein geschätzter Koeffizient nahe null weist darauf hin, dass der Effekt des Prädiktors klein oder nicht vorhanden ist.

Die Interpretation der geschätzten Koeffizienten für die kategorialen Prädiktoren bezieht sich auf die Referenzstufe des Prädiktors. Positive Koeffizienten weisen darauf hin, dass das Ereignis auf dieser Stufe des Prädiktors wahrscheinlicher als auf der Referenzstufe des Faktors ist. Negative Koeffizienten weisen darauf hin, dass das Ereignis auf dieser Stufe des Prädiktors weniger wahrscheinlich als auf der Referenzstufe ist.

Der Koeffizient für die Stunden seit der Reinigung ist positiv, was darauf hindeutet, dass eine höhere Stundenzahl mit höheren Werten der Antwortvariablen verbunden sind. Der Koeffizient für die Temperatur ist negativ, was darauf hindeutet, dass höhere Temperaturen mit niedrigeren Werten der Antwortvariablen verbunden sind.

Die Schraubengröße ist eine kategoriale Variable mit einem Koeffizienten, was darauf hindeutet, dass die Variable 2 Stufen aufweist und die (0, 1)-Kodierung verwendet. Der Koeffizient für die kleine Schraube ist negativ. Folglich ist die kleine Schraube mit Werten der Antwortvariablen verbunden, die niedriger sind als die Referenzstufe.

Wenn ein Wechselwirkungsterm statistisch signifikant ist, weicht die Beziehung zwischen einem Prädiktor und der Antwortvariablen um die Stufe des anderen Prädiktors ab. In diesem Fall sollten Sie die Haupteffekte nicht interpretieren, ohne dabei den Wechselwirkungseffekt zu berücksichtigen. Um ein besseres Verständnis der Haupteffekte, der Wechselwirkungseffekte und der Krümmung im Modell zu erlangen, wählen Sie Faktordiagramme und Zielgrößenoptimierung aus.

Schritt 2: Bestimmen, ob das Modell nicht an Ihre Daten angepasst ist

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Anzahlen der Ereignisse auf eine Weise von den beobachteten Anzahlen der Ereignisse abweichen, die die Poisson-Verteilung nicht prognostiziert. Wenn der p-Wert für den Test auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, können Sie die Nullhypothese verwerfen, die besagt, dass die Poisson-Verteilung eine gute Anpassung bietet. In der folgenden Liste finden Sie häufige Ursachen für Abweichungen:
  • Falsche Linkfunktion
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist
  • Überdispersion

Wenn die Abweichung statistisch signifikant ist, können Sie eine andere Linkfunktion verwenden oder die Terme im Modell ändern.

Tests auf Güte der Anpassung

TestDFSchätzwertMittelwertChi-Quadratp-Wert
Abweichung3231,607220,9877331,610,486
Pearson3231,267130,9771031,270,503
Wichtigste Ergebnisse: Abweichungstest, Pearson-Test

In diesen Ergebnissen sind die p-Werte beider Tests auf die Güte der Anpassung höher als das übliche Signifikanzniveau von 0,05. Es liegen nicht genügend Anzeichen für die Schlussfolgerung vor, dass die prognostizierte Anzahl der Ereignisse von der beobachteten Anzahl der Ereignisse abweicht.

Schritt 3: Bestimmen, wie gut das Modell an die Daten angepasst ist

Anhand des AIC, des AICc und des BIC können Sie verschiedene Modelle vergleichen. Bei jeder dieser Statistiken sind kleinere Werte erwünscht. Das Modell mit dem kleinsten Wert für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch die Tests auf die Güte der Anpassung und die Residuendiagramme, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Zusammenfassung des Modells

R-Qd der
Abweichung
R-Qd(kor)
der
Abweichung
AICAICcBIC
64,20%60,80%253,29254,58259,62

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante4,39820,062870,020,000 
Stunden seit Reinigung0,017980,008262,180,0291,00
Temperatur-0,0019740,000318-6,200,0001,00
Schraubengröße         
  klein-0,15460,0427-3,620,0001,00
Wichtigste Ergebnisse: AIC

Im ersten Ergebnissatz beträgt das AIC ungefähr 253. Das AICc beträgt ungefähr 255. Das BIC beträgt ungefähr 260. Dieses Modell enthält nicht die Wechselwirkung zwischen Temperatur und Schraubengröße. Das Informationskriterium eines einzelnen Modells sagt nichts darüber aus, wie gut das Modell an die Daten angepasst ist, da die Werte vom Stichprobenumfang abhängen.

Zusammenfassung des Modells

R-Qd der
Abweichung
R-Qd(kor)
der
Abweichung
AICAICcBIC
85,99%81,46%236,05238,05243,97

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante4,57600,073662,150,000 
Stunden seit Reinigung0,017980,008262,180,0291,00
Temperatur-0,0032850,000441-7,460,0001,92
Schraubengröße         
  klein-0,54440,0990-5,500,0005,37
Temperatur*Schraubengröße         
  klein0,0028040,0006404,380,0006,64

Im zweiten Ergebnissatz beträgt das AIC ungefähr 236. Das AICc beträgt ungefähr 238. Das BIC beträgt ungefähr 244. Dieses Modell enthält die Wechselwirkung zwischen Temperatur und Schraubengröße. Die kleineren Werte weisen darauf hin, dass sich das Modell mit der Wechselwirkung besser eignet.