Statistiken zur Zusammenfassung des Modells für Darstellung der binären Anpassungslinie

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken in der Tabelle mit der Zusammenfassung des Modells.

R-Qd der Abweichung

Das R2 der Abweichung wird im Allgemeinen als Anteil der Abweichung der Antwortvariablen angesehen, der vom Modell erklärt wird.

Interpretation

Je höher das R2 der Abweichung ausfällt, desto besser ist das Modell an die Daten angepasst. Das R2 der Abweichung liegt immer zwischen 0 % und 100 %.

Das R2 der Abweichung nimmt beim Einbinden zusätzlicher Prädiktoren in ein Modell stets zu. Das beste Modell mit fünf Prädiktoren weist beispielsweise immer ein R2 auf, das mindestens so hoch wie das des besten Modells mit vier Prädiktoren ist. Daher ist das R2 der Abweichung am nützlichsten, wenn Sie Modelle derselben Größe vergleichen.

R2 der Abweichung ist lediglich ein Maß dafür, wie gut das Modell an die Daten angepasst ist. Selbst wenn ein Modell ein hohes R2 aufweist, sollten Sie die Residuendiagramme und die Tests auf Güte der Anpassung untersuchen, um zu beurteilen, wie gut das Modell an die Daten angepasst ist.

Sie können eine Darstellung der Anpassungslinie verwenden, um verschiedene Werte des R2 der Abweichung grafisch zu veranschaulichen. Das erste Diagramm zeigt ein Modell, das ungefähr 96 % der Abweichung in der Antwortvariablen erklärt. Das zweite Diagramm zeigt ein Modell, das ungefähr 60 % der Abweichung in der Antwortvariablen erklärt. Je mehr der Abweichung durch das Modell erklärt wird, desto näher liegen die Datenpunkte an der Kurve. Würde ein Modell theoretisch 100 % der Abweichung erklären, wären die angepassten Werte immer gleich den beobachteten Werten, und alle Datenpunkte würden auf der Kurve liegen.

Das Datenformat beeinflusst den Wert von R2 der Abweichung. Im Allgemeinen ist das R2 der Abweichung für Daten im Ereignis-/Versuchsformat höher. Werte des R2 der Abweichung sind nur zwischen Modellen vergleichbar, in denen dasselbe Datenformat verwendet wird. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

R-Qd(kor) der Abweichung

Das korrigierte R2 der Abweichung ist der Anteil der Abweichung der Antwortvariablen, der durch das Modell erklärt wird, korrigiert nach der Anzahl der Prädiktoren im Modell in Bezug auf die Anzahl der Beobachtungen.

Interpretation

Verwenden Sie das korrigierte R2 der Abweichung, wenn Sie Modelle vergleichen möchten, die eine unterschiedliche Anzahl von Prädiktoren enthalten. Das R2 der Abweichung nimmt beim Einbinden eines Prädiktors in ein Modell stets zu. Der Wert des korrigierten R2 der Abweichung berücksichtigt die Anzahl der Prädiktoren im Modell, was die Auswahl des richtigen Modells erleichtert.

Angenommen, Sie sind für einen Hersteller von Kartoffelchips tätig, der die Faktoren untersucht, die sich auf zerkrümelte Kartoffelchips auswirken. Beim Hinzufügen der Prädiktoren erhalten Sie die folgenden Ergebnisse:
Schritt %Kartoffel Abkühlgeschwindigkeit Frittiertemperatur R2 der Abweichung Korrigiertes R2 der Abweichung p-Wert
1 X     52 % 51 % 0,000
2 X X   63 % 62 % 0,000
3 X X X 65 % 62 % 0,000

Der erste Schritt ergibt ein statistisch signifikantes Regressionsmodell. Im zweiten Schritt wird dem Modell die Abkühlgeschwindigkeit hinzugefügt; dadurch nimmt das korrigierte R2 der Abweichung zu, was darauf hinweist, dass die Abkühlgeschwindigkeit das Modell verbessert. Im dritten Schritt, in dem die Frittiertemperatur zum Modell hinzugefügt wird, nimmt das R2 der Abweichung, nicht aber das korrigierte R2 der Abweichung zu. Diese Ergebnisse deuten darauf hin, dass das Modell durch die Frittiertemperatur nicht verbessert wird. Auf der Grundlage dieser Ergebnisse erwägen Sie, die Frittiertemperatur aus dem Modell zu entfernen.

Bei der binären logistischen Regression wirkt sich das Format der Daten auf den Wert des korrigierten R2 der Abweichung aus. Bei denselben Daten ist das korrigierte R2 der Abweichung in der Regel höher, wenn die Daten im Ereignis-/Versuchsformat und nicht im binären Antwort-/Häufigkeitenformat vorliegen. Verwenden Sie das korrigierte R2 der Abweichung nur zum Vergleichen der Anpassung von Modellen, die dasselbe Datenformat aufweisen. Weitere Informationen finden Sie unter Wie wirken sich Datenformate bei der binären logistischen Regression auf die Güte der Anpassung aus?.

AIC

Das AIC (Akaike Information Criterion) ist ein Maß der relativen Qualität eines Modells, bei dem sowohl die Anpassung als auch die Anzahl der Terme im Modell berücksichtigt werden. Die Statistik kann ohne einen Vergleichswert nicht interpretiert werden.

Interpretation

Anhand des AIC können Sie verschiedene Modelle vergleichen. Je kleiner das AIC, desto besser ist das Modell an die Daten angepasst. Das Modell mit dem kleinsten AIC für eine Gruppe von Prädiktoren ist jedoch nicht zwangsläufig gut an die Daten angepasst. Verwenden Sie daher auch mit den Tests auf Güte der Anpassung und Residuendiagrammen, um zu beurteilen, wie gut ein Modell an die Daten angepasst ist.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien