Restflächen für Binäres logistisches Modell anpassen und Binäre logistische Regression

Hier finden Sie Definitionen und Anleitungen zur Interpretation für die Residuendiagramme.

Histogramm der Residuen

Im Histogramm der Abweichungsresiduen wird die Verteilung der Residuen für alle Beobachtungen veranschaulicht.

Das Diagramm wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Interpretation

Verwenden Sie das Histogramm der Residuen, um zu ermitteln, ob die Daten schief sind oder Ausreißer in den Daten vorliegen. Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt. Wenn das Modell die Annahmen nicht erfüllt, sind die auf einer Normal-Approximation basierenden Konfidenzintervalle für die Prognosen wahrscheinlich ungenau.
Muster Mögliche Bedeutung des Musters
Ein langer Randbereich in einer Richtung Schiefe
Ein Balken weit entfernt von den anderen Balken Ein Ausreißer

Da die Darstellung eines Histogramms von der Anzahl der Intervalle abhängt, mit denen die Daten gruppiert werden, verwenden Sie ein Histogramm nicht, um die Normalverteilung der Residuen zu beurteilen. Verwenden Sie dazu stattdessen ein Wahrscheinlichkeitsnetz für Normalverteilung.

Wahrscheinlichkeitsnetz (Normal) für Residuen

Das Wahrscheinlichkeitsnetz (Normal) für Residuen stellt die Residuen im Vergleich zu den Werten dar, die bei Vorliegen einer Normalverteilung erwartet würden.

Das Diagramm wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Interpretation

Verwenden Sie das Wahrscheinlichkeitsnetz (Normal) der Residuen, um die Annahme zu überprüfen, dass die Residuen normalverteilt sind. Die Residuen im Wahrscheinlichkeitsnetz für Normalverteilung sollten ungefähr einer Geraden folgen.

Die folgenden Muster verletzen die Annahme, dass die Residuen normalverteilt sind.

Die S-Kurve deutet auf eine Verteilung mit langen Randbereichen hin.

Die invertierte S-Kurve deutet auf eine Verteilung mit kurzen Randbereichen hin.

Eine Abwärtskurve deutet auf eine rechtsschiefe Verteilung hin.

Wenige Punkte, die abseits der Linie liegen, deuten auf eine Verteilung mit Ausreißern hin.

Wenn Sie ein nicht normalverteiltes Muster feststellen, prüfen Sie das Modell anhand der übrigen Residuendiagramme auf andere Probleme, z. B. auf fehlende Terme oder einen Effekt der chronologischen Reihenfolge. Wenn die Residuen keiner Normalverteilung folgen, sind die Konfidenzintervalle der Normal-Approximation und die p-Werte des Wald-Tests möglicherweise ungenau.

Residuen vs. Anpassungen

Im Diagramm der Residuen im Vergleich zu den Anpassungen werden die Residuen auf der y-Achse und der Logit der angepassten Werte auf der x-Achse aufgetragen.
Hinweis

Bei der binären logistischen Regression stellt Minitab dieses Diagramm nicht bereit, wenn die Daten im binären Antwort-/Häufigkeitenformat vorliegen (ein Versuch pro Zeile).

Das Diagramm wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Interpretation

Verwenden Sie das Diagramm der Residuen im Vergleich zu den Anpassungen, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind. Im Idealfall sollten die Punkte zufällig auf beiden Seiten von null verteilt sein, und es sollten keine Muster in den Punkten erkennbar sein.

Die Muster in der folgenden Tabelle können darauf hinweisen, dass das Modell die Modellannahmen nicht erfüllt.
Muster Mögliche Bedeutung des Musters
Aufgefächerte oder ungleichmäßig gestreute Residuen für die angepassten Werte Eine ungeeignete Linkfunktion
Krümmung Ein fehlender Term höherer Ordnung oder eine ungeeignete Linkfunktion
Ein weit von null entfernt liegender Punkt Ein Ausreißer
Ein in x-Richtung weit von den anderen Punkten entfernter Punkt Ein einflussreicher Punkt
Die folgenden Grafiken zeigen einen Ausreißer sowie eine Verletzung der Annahme, dass die Varianz der Residuen konstant ist.
Diagramm mit Ausreißer

Einer der Punkte ist viel größer als alle anderen Punkte. Daher handelt es sich bei dem Punkt um einen Ausreißer. Wenn zu viele Ausreißer auftreten, ist das Modell möglicherweise nicht akzeptabel. Versuchen Sie nach Möglichkeit, die Ursache von Ausreißern zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Datenwerte zu entfernen, die auf ungewöhnliche, einmalige Ereignisse (Ausnahmebedingungen) zurückzuführen sind. Wiederholen Sie anschließend die Analyse.

Diagramm mit nicht konstanter Varianz

Die Varianz der Residuen nimmt mit den angepassten Werten zu. Beachten Sie, dass sich bei zunehmenden Werten der Anpassungen die Streuung der Residuen verbreitert. Dieses Muster weist darauf hin, dass die Varianzen der Residuen ungleich (nicht konstant) sind.

Wenn Sie Muster oder Ausreißer in einem Diagramm der Residuen im Vergleich zu den Anpassungen feststellen, erwägen Sie die folgenden Lösungen:
Problem Mögliche Lösung
Nicht konstante Varianz Erwägen Sie, andere Terme im Modell, eine andere Linkfunktion oder Gewichtungen zu verwenden.
Ein Ausreißer oder ein einflussreicher Punkt
  1. Stellen Sie sicher, dass die Beobachtung kein Mess- oder Dateneingabefehler ist.
  2. Ziehen Sie in Betracht, die Analyse ohne diese Beobachtung durchzuführen. Dadurch können Sie deren Einfluss auf Ihre Ergebnisse ermitteln.

Residuen vs. Reihenfolge

Das Diagramm der Residuen im Vergleich zur Reihenfolge zeigt die Residuen in der Reihenfolge an, in der die Daten erfasst wurden.

Das Diagramm wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Interpretation

Verwenden Sie das Diagramm der Residuen im Vergleich zur Reihenfolge, um die Annahme zu überprüfen, dass die Residuen zufällig verteilt sind. Bei in chronologischer Reihenfolge angezeigten unabhängigen Residuen sind weder Trends noch Muster zu erkennen. Muster in den Punkten können darauf hinweisen, dass nahe beieinander liegende Residuen korrelieren und daher nicht unabhängig sind. Im Idealfall sollten die Residuen im Diagramm zufällig um die Mittellinie gestreut sein:
Wenn Sie ein Muster erkennen, untersuchen Sie die Ursache. Die folgenden Typen von Mustern können darauf hinweisen, dass die Residuen abhängig sind.
Trend
Shift
Zyklus

Residuen vs. Variablen

Das Diagramm der Residuen im Vergleich zu den Variablen veranschaulicht die Residuen im Vergleich zu einer anderen Variablen. Die Variable kann bereits im Modell enthalten sein. Es ist auch möglich, dass die Variable nicht im Modell enthalten ist, und Sie vermuten, dass sie die Antwortvariable beeinflusst.

Das Diagramm wird ungeachtet davon, ob Abweichungsresiduen oder Residuen nach Pearson verwendet werden, gleich interpretiert. Wenn im Modell die Logit-Linkfunktion verwendet wird, liegt die Verteilung der Abweichungsresiduen näher an der Verteilung der Residuen aus einem Regressionsmodell kleinster Quadrate. Bei zunehmender Anzahl der Versuche für jede Kombination von Prädiktoreinstellungen werden die Abweichungsresiduen und die Residuen nach Pearson einander ähnlicher.

Interpretation

Wenn die Variable bereits in das Modell eingebunden wurde, ermitteln Sie anhand des Diagramms, ob für diese Variable ein Term höherer Ordnung hinzugefügt werden sollte. Wenn die Variable nicht bereits in das Modell eingebunden wurde, ermitteln Sie anhand des Diagramms, ob diese Variable die Antwortvariable systematisch beeinflusst.

Diese Muster können auf eine wichtige Variable oder einen wichtigen Term hinweisen.
Muster Mögliche Bedeutung des Musters
Muster in Residuen Die Variable wirkt sich systematisch auf die Antwortvariable aus. Wenn sich die Variable nicht im Modell befindet, binden Sie einen Term für diese Variable ein, und passen Sie das Modell erneut an.
Krümmung in den Punkten Es sollte ein Term höherer Ordnung der Variablen in das Modell eingebunden werden. Eine Krümmung deutet beispielsweise darauf hin, dass Sie einen quadratischen Term hinzufügen sollten.