Methoden und Formeln für die diagnostischen Maßnahmen in Binäres logistisches Modell anpassenund Binäre logistische Regression

Wählen Sie die gewünschte Methode oder Formel aus.

Residuen nach Pearson

Hierbei handelt es sich um Elemente der Chi-Quadrat-Statistik nach Pearson, mit denen Sie schlecht angepasste Faktoren-/Kovariatenmuster erkennen können. Minitab speichert das Residuum nach Pearson für das i-te Faktoren-/Kovariatenmuster. Die Formel lautet:

Notation

BegriffBeschreibung
yiWert der Antwortvariablen für das i-te Faktoren-/Kovariatenmuster
angepasster Wert für das i-te Faktoren-/Kovariatenmuster
VVarianzfunktion für das Modell bei

Die Varianzfunktion hängt vom Modell ab:

Modell Varianzfunktion
Binomial
Poisson

Standardisierte und entfernte Residuen nach Pearson

Hiermit können Sie schlecht angepasste Faktoren-/Kovariatenmuster erkennen. Minitab speichert das standardisierte Residuum nach Pearson für das i-te Faktoren-/Kovariatenmuster. Entfernte Residuen nach Pearson werden auch als Likelihood-Quotienten-Residuen nach Pearson bezeichnet. Für das entfernte Residuum nach Pearson berechnet Minitab die in Pregibon1 beschriebene Ein-Schritt-Approximation. Diese Approximation entspricht dem standardisierten Residuum nach Pearson. Die Formel lautet:

Notation

BegriffBeschreibung
Residuum nach Pearson für das i-te Faktoren-/Kovariatenmuster
1, für die Binomial- und Poisson-Modelle
Hebelwirkung für das i-te Faktoren-/Kovariatenmuster

Standardisierte Residuen nach Pearson mit Validierung

Bei Validierungsdaten wird im Nenner der Formel für das standardisierte Residuum nach Pearson die Hebelwirkung addiert und nicht subtrahiert.

Formel

Notation

BegriffBeschreibung
the Pearson residual for the i-te validation row
1, for the binomial and Poisson models
the leverage for the i-te validation row

Abweichungsresiduen

Abweichungsresiduen basieren auf der Modellabweichung und sind hilfreich, um schlecht angepasste Faktoren-/Kovariatenmuster zu identifizieren. Die Modellabweichung ist eine Statistik zur Güte der Anpassung, die auf der Log-Likelihood-Funktion beruht. Das für das i-te Faktoren-/Kovariatenmuster definierte Abweichungsresiduum ist:

Notation

BegriffBeschreibung
yi Wert der Antwortvariablen für das i-te Faktoren-/Kovariatenmuster
angepasster Wert für das i-te Faktoren-/Kovariatenmuster
Abweichung für das i-te Faktoren-/Kovariatenmuster

Standardisiertes Abweichungsresiduum

Das standardisierte Abweichungsresiduum ist hilfreich beim Identifizieren von Ausreißern. Die Formel lautet:

Notation

BegriffBeschreibung
rD,iAbweichungsresiduum für das i-te Faktoren-/Kovariatenmuster
hiHebelwirkung für das i-te Faktoren-/Kovariatenmuster

Standardisiertes Abweichungsresiduum mit Validierung

Bei Validierungsdaten wird im Nenner der Formel für das standardisierte Abweichungsresiduum die Hebelwirkung addiert und nicht subtrahiert.

Formel

Notation

BegriffBeschreibung
rD,iThe deviance residual for the i-te validation row
hiThe leverage for the i-te validation row

Gelöschtes Abweichungsresiduum

Das entfernte Abweichungsresiduum ist ein Maß für die Änderung in der Abweichung, die auf das Entfernen des i-ten Falls aus den Daten zurückzuführen ist. Entfernte Abweichungsresiduen werden auch als Likelihood-Quotienten-Abweichungsresiduen bezeichnet. Für das entfernte Abweichungsresiduum berechnet Minitab eine Ein-Schritt-Approximation auf der Grundlage der Ein-Schritt-Approximationsmethode nach Pregibon1. Die Formel lautet:

Notation

BegriffBeschreibung
yiWert der Antwortvariablen beim i-ten Faktoren-/Kovariatenmuster
angepasster Wert für das i-te Faktoren-/Kovariatenmuster
hiHebelwirkung für das i-te Faktoren-/Kovariatenmuster
r'D,istandardisiertes Abweichungsresiduum für das i-te Faktoren-/Kovariatenmuster
r'P,istandardisiertes Residuum nach Pearson für das i-te Faktoren-/Kovariatenmuster

1. Pregibon, D. (1981). „Logistic Regression Diagnostics.“ The Annals of Statistics, Vol. 9, No. 4, S. 705–724.

Delta-Chi-Quadrat

Minitab berechnet die Änderung im Chi-Quadrat nach Pearson, die dadurch bedingt ist, dass alle Beobachtungen mit dem j-ten Faktoren-/Kovariatenmuster entfernt wurden. Für jedes eindeutige Faktoren-/Kovariatenmuster in den Daten speichert Minitab einen Delta-Chi-Quadrat-Wert. Mit Hilfe des Delta-Chi-Quadrats können Sie schlecht angepasste Faktoren-/Kovariatenmuster erkennen. Die Formel für das Delta-Chi-Quadrat lautet:

Formel

Notation

BegriffBeschreibung
hj Hebelwirkung
rj Residuen nach Pearson

Delta-Abweichung

Minitab berechnet die Änderung in der Abweichungsstatistik, indem alle Beobachtungen mit dem j-ten Faktoren-/Kovariatenmuster entfernt werden. Für jedes eindeutige Faktoren-/Kovariatenmuster in den Daten speichert Minitab einen Wert. Mit Hilfe der Delta-Abweichung können Sie schlecht angepasste Faktoren-/Kovariatenmuster erkennen. Die Änderung in der Abweichungsstatistik lautet:

Notation

BegriffBeschreibung
hjHebelwirkung
rjResiduen nach Pearson
djAbweichungsresiduen

Delta-Beta (standardisiert)

Minitab berechnet die Änderung, indem alle Beobachtungen mit dem j-ten Faktoren-/Kovariatenmuster entfernt werden. Für jedes eindeutige Faktoren-/Kovariatenmuster in den Daten wird ein Wert gespeichert. Mit Hilfe des standardisierten Delta-β können Faktor-/Kovariatenmuster erkannt werden, die einen starken Einfluss auf die Schätzwerte der Koeffizienten haben. Dieser Wert basiert auf dem standardisierten Residuum nach Pearson.

Formel

Notation

BegriffBeschreibung
hj Hebelwirkung
rs j standardisierte Residuen nach Pearson

Delta-Beta

Minitab berechnet die Änderung, indem alle Beobachtungen mit dem j-ten Faktoren-/Kovariatenmuster entfernt werden. Für jedes eindeutige Faktoren-/Kovariatenmuster in den Daten wird ein Wert gespeichert. Mit Hilfe des Delta-β können Faktor-/Kovariatenmuster erkannt werden, die einen starken Einfluss auf die Schätzwerte der Koeffizienten haben. Dieser Wert basiert auf dem Residuum nach Pearson.

Formel

Notation

BegriffBeschreibung
hj Hebelwirkung
rj Residuen nach Pearson

Hebelwirkungen

Die Hebelwirkungen sind die Diagonalelemente der verallgemeinerten „Dach-Matrix“ (Hat-Matrix). Die Hebelwirkungen sind nützlich, um Faktoren-/Kovariatenmuster zu erkennen, die möglicherweise einen signifikanten Einfluss auf die Ergebnisse haben.

Formel

Notation

BegriffBeschreibung
wj j-tes Diagonalelement der Gewichtungsmatrix aus der Anpassung der Koeffizienten
xjj-te Zeile der Designmatrix
XDesignmatrix
X'transponiertes X
WGewichtungsmatrix aus der Schätzung der Koeffizienten

Hebelwirkungen mit Validierung

Notation

BegriffBeschreibung
wi the internal weight for the i-te validation row
xithe row of the design matrix for the predictors in the i-te validation row
Xthe design matrix for the training data set
X'the transpose of X
Wthe diagonal matrix of internal weights for the training data set

Cook-Distanz

Minitab berechnet eine ungefähre Cook-Distanz.

Formel

Notation

BegriffBeschreibung
hiHebelwirkung für das i-te Faktoren-/Kovariatenmuster
standardisiertes Residuum nach Pearson für das i-te Faktoren-/Kovariatenmuster
pFreiheitsgrade der Regression

DFITS

Ein Maß für den Einfluss einer einzelnen Entfernung auf die angepassten Werte. Bei Beobachtungen mit großen DFITS-Werten handelt es sich möglicherweise um Ausreißer. Minitab berechnet einen ungefähren Wert für DFITS.

Formel

Notation

BegriffBeschreibung
hiHebelwirkung für den Datenpunkt
Das entfernte Residuum nach Pearson für den Datenpunkt

Varianzinflationsfaktor (VIF)

Um einen VIF zu berechnen, führen Sie eine gewichtete Regression auf den Prädiktor mit den verbleibenden Prädiktoren durch. Die Gewichtungsmatrix entspricht der in McCullagh und Nelder1 für die Schätzung der Koeffizienten angegebenen Matrix. In diesem Fall entspricht die VIF-Formel der Formel für eine lineare Regression. Für den Prädiktor xj lautet die Formel für den VIF beispielsweise:

Notation

BegriffBeschreibung
Determinationskoeffizient mit xj als Antwortvariable und den anderen Termen im Modell als Prädiktoren

1. P. McCullagh und J. A. Nelder (1989). Generalized Linear Models, 2nd Edition, Chapman & Hall/CRC, London.