Methoden und Formeln für die Zusammenfassung des Modells in Binäres logistisches Modell anpassen

Wählen Sie die gewünschte Methode oder Formel aus.

R2 der Abweichung

Das R2 der Abweichung gibt an, wie viel der Streuung in der Antwortvariablen durch das Modell erklärt wird. Je höher das R2, desto besser ist das Modell an die Daten angepasst. Die Formel lautet wie folgt:

Notation

BegriffBeschreibung
DEError Deviance
DTTotal Deviance

Korrigiertes R2 der Abweichung

Das korrigierte R2 der Abweichung berücksichtigt die Anzahl der Prädiktoren in dem Modell und eignet sich zum Vergleichen von Modellen mit unterschiedlichen Anzahlen von Prädiktoren. Die Formel lautet:

Notation

BegriffBeschreibung
R2R2 der Abweichung
pFreiheitsgrade der Regression
Φ1, für Binomial- und Poisson-Modelle
DTGesamtabweichung

Obwohl die Berechnungen für das korrigierte R2 der Abweichung negative Werte ergeben können, wird in Minitab für derartige Fälle null angezeigt.

Akaike Information Criterion (AIC)

Verwenden Sie diese Statistik, um verschiedene Modelle zu vergleichen. Je kleiner das AIC, desto besser ist das Modell an die Daten angepasst.

Die Log-Likelihood-Funktionen sind in Bezug auf die Mittelwerte parametrisiert. Die allgemeine Form der Funktionen lautet:

Die allgemeine Form der individuellen Beiträge lautet:

Die spezifische Form der individuellen Beiträge hängt vom Modell ab.

Modell li
Binomial
Poisson

Notation

BegriffBeschreibung
pFreiheitsgrade der Regression
LcLog-Likelihood des aktuellen Modells
yiAnzahl der Ereignisse für die i-te Zeile
miAnzahl der Versuche für die i-te Zeile
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile

Akaikes korrigiertes Informationskriterium (AICc)

Das AICc wird nicht berechnet, wenn .

Notation

BegriffBeschreibung
pAnzahl der Koeffizienten im Modell einschließlich der Konstante
nAnzahl der Datenzeilen ohne fehlende Daten

Bayessches Informationskriterium (BIC)

Notation

BegriffBeschreibung
pAnzahl der Koeffizienten im Modell, wobei die Konstante nicht gezählt wird
nAnzahl der Datenzeilen ohne fehlende Daten

R2 der Abweichung für Test

Das R2 der Abweichung für den Test gibt an, welcher Teil der Streuung in der Antwortvariablen des Testdatensatzes durch das Modell erklärt wird. Je höher der Wert, desto besser ist das Modell passend für Ihre Daten.

Formel

Die folgende Gleichung gibt die Formel für das R2 der Abweichung für den Test an:

Hierbei stellt die folgende Gleichung die Fehlerabweichung dar:

Und die folgende Gleichung stellt die Gesamtabweichung dar:
Für Modelle mit einem konstanten Term ist wie folgt definiert:

Für Modelle ohne konstanten Term ist = 0,5.

Notation

BegriffBeschreibung
N(Test)the number of rows in the test data set
the squared deviance residuals
yithe number of events for the i-te row in the test data set
mithe number of trials for the i-te row in the test data set
DE(Test)the error deviance for the test data set
DT(Test)the total deviance for the test data set

Fläche unterhalb der ROC-Kurve

Formel

Für die Fläche unterhalb der Kurve verwendet Minitab eine Integration.

In den meisten Fällen entspricht dieses Integral der folgenden Summe von Trapezen:

Dabei gilt Folgendes: k ist die Anzahl der eindeutigen Ereigniswahrscheinlichkeiten, und (x0, y0) ist der Punkt (0, 0).

Angenommen, es gibt vier eindeutige Ereigniswahrscheinlichkeiten mit den folgenden Koordinaten auf der ROC-Kurve:
x (Falsch-Positiv-Rate) y (Richtig-Positiv-Rate)
0,0923 0,3051
0,4154 0,7288
0,7538 0,9322
1 1
Dann wird die Fläche unterhalb der ROC-Kurve durch die folgende Berechnung angegeben:

Notation

BegriffBeschreibung
TRP true positive rate
FPR false positive rate
TPtrue positive, events that were correctly assessed
P number of actual positive events
FPtrue negative, nonevents that were correctly assessed
N number of actual negative events
FNRfalse negative rate
TNRtrue negative rate
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien