Wählen Sie die Optionen für Binäres logistisches Modell anpassen und Binäre logistische Regression

Statistik > Regression > Binäre logistische Regression > Binäres logistisches Modell anpassen > Optionen

Predictive Analytics-Modul > Binäre logistische Regression > Optionen

In diesem Thema

Linkfunktion
Gewichtungen
Konfidenzniveau für alle Intervalle
Typ des Konfidenzintervalls
Residuen für Bewertung
Test für ANOVA-Tabelle
Anzahl der Gruppen für den Hosmer-Lemeshow-Test

Linkfunktion

Minitab bietet drei Linkfunktionen, mit denen Sie eine breite Auswahl von Modellen für binäre Antwortvariablen anpassen können. Eine Linkfunktion stellt die Umkehrung einer Verteilungsfunktion dar. Es empfiehlt sich, eine Linkfunktion auszuwählen, die zu einer guten Anpassung an die Daten führt. Untersuchen Sie die Statistiken für die Güte der Anpassung in der Ausgabe, um zu vergleichen, wie gut das Modell mit unterschiedlichen Linkfunktionen an die Daten angepasst ist. Sie können Linkfunktionen auch aus historischen Gründen verwenden, oder weil sie eine bestimmte Bedeutung in Ihrer Disziplin haben. Weitere Informationen finden Sie unter Was ist eine Linkfunktion?.

Logit: Standardmäßig verwendet Minitab die Logit-Linkfunktion, da sie die natürlichste Interpretation der geschätzten Koeffizienten darstellt und Schätzwerte für die Chancenverhältnisse liefert.
Normit/Probit: Verwenden Sie die Normit-Linkfunktion, bei der angenommen wird, dass eine zugrunde liegende Variable vorhanden ist, die einer Normalverteilung folgt und in Kategorien unterteilt ist. Angenommen, dass die Pestizidresistenz ein nicht messbares Merkmal eines Insekts ist, das einer Normalverteilung folgt. Statt jedoch die Pestizidresistenz zu erfassen, klassifizieren Sie die Insekten in Kategorien von Insekten, die bei unterschiedlichen Pestiziddosierungen überlebt haben oder gestorben sind.
Gompit/komplementärer Log-Log: Verwenden Sie die Gompit-Funktion, die die Umkehrung der Gompertz-Verteilungsfunktion darstellt. Wenn die Logit- oder Normit-Funktion nicht gut an die Daten angepasst ist, kann die Gompit-Funktion gelegentlich eine angemessene Anpassung bieten, da sie asymmetrisch ist.

Gewichtungen

Geben Sie im Feld Gewichtungen eine numerische Spalte mit Gewichtungen ein, um eine gewichtete Regression durchzuführen. Die Gewichtungen müssen größer oder gleich null sein. Die Spalte mit den Gewichtungen muss dieselbe Anzahl von Zeilen wie die Spalte mit der Antwortvariablen aufweisen. Weitere Informationen zum Ermitteln der geeigneten Gewichtung finden Sie unter Gewichtete Regression.

Konfidenzniveau für alle Intervalle

Geben Sie das Konfidenzniveau für die Konfidenzintervalle für die Koeffizienten und die angepassten Werte ein. Wenn Sie die Logit-Linkfunktion verwenden, entspricht dieses Konfidenzniveau auch dem Konfidenzniveau für die Konfidenzintervalle der Chancenverhältnisse.

In der Regel ist ein Konfidenzniveau von 95 % gut geeignet. Ein 95%-Konfidenzniveau gibt an, dass bei einer Entnahme von 100 Zufallsstichproben aus der Grundgesamtheit die Konfidenzintervalle für ungefähr 95 der Stichproben den Parameter enthalten, der mit dem Intervall geschätzt wird. Für einen bestimmten Datensatz erzeugt ein niedrigeres Konfidenzniveau ein schmaleres Intervall, während mit einem höheren Konfidenzniveau ein breiteres Intervall erzielt wird.

Hinweis

Um die Konfidenzintervalle für die Koeffizienten und angepassten Werte anzuzeigen, müssen Sie das Unterdialogfeld Ergebnisse aufrufen und unter Darstellung der Ergebnisse die Option Erweiterte Tabellen auswählen.

Typ des Konfidenzintervalls

Sie können ein beidseitiges Intervall oder eine einseitige Grenze auswählen. Bei demselben Konfidenzniveau liegt eine Grenze näher an der Punktschätzung als das Intervall. Die Obergrenze liefert keinen wahrscheinlichen unteren Wert. Die Untergrenze liefert keinen wahrscheinlichen oberen Wert.

Beidseitig: Verwenden Sie ein beidseitiges Konfidenzintervall, um eine wahrscheinliche Untergrenze und eine wahrscheinliche Obergrenze für die Wahrscheinlichkeit des Ereignisses zu schätzen.
Untergrenze: Verwenden Sie eine untere Konfidenzgrenze, um eine wahrscheinliche Untergrenze für die Wahrscheinlichkeit des Ereignisses zu schätzen.
Obergrenze: Verwenden Sie eine obere Konfidenzgrenze, um eine wahrscheinliche Obergrenze für die Wahrscheinlichkeit des Ereignisses zu schätzen.

Residuen für Bewertung

Die Abweichungsresiduen und die Residuen nach Pearson unterstützen Sie beim Erkennen von Mustern und Ausreißern in den Residuendiagrammen. Beobachtungen, an die das Modell nicht gut angepasst ist, weisen hohe Abweichungsresiduen und Residuen nach Pearson auf. Minitab berechnet die Residuenwerte für jedes eindeutige Faktoren-/Kovariatenmuster.

Abweichung: Abweichungsresiduen sind ein Maß dafür, wie gut das Modell die Beobachtung prognostiziert. Für eine logistische Regression, bei der die Logit-Linkfunktion verwendet wird, werden häufig Abweichungsresiduen bevorzugt, da die Verteilung der Residuen stärker der Verteilung der Residuen aus Modellen kleinster Quadrate ähnelt. Die Logit-Linkfunktion ist die am häufigsten verwendete Linkfunktion.
Pearson: Residuen nach Pearson sind ebenfalls ein Maß dafür, wie präzise das Modell die Beobachtung prognostiziert. Ein gängiger Ansatz zum Ermitteln von Ausreißern besteht darin, die Residuen nach Pearson gemäß der Reihenfolge der Beobachtungen im Arbeitsblatt grafisch darzustellen.

Test für ANOVA-Tabelle

Wählen Sie den Test für die ANOVA-Tabelle aus.

Wald-Test: Der standardmäßige Wald-Test ist in der Regel gut geeignet.
Likelihood-Quotienten-Test: Wählen Sie diese Option aus, wenn Sie den Likelihood-Quotienten-Test bevorzugen.

Typ der Abweichung

Wählen Sie eine Abweichung zum Berechnen der Chi-Quadrat-Werte und der p-Werte aus. Am häufigsten wird die korrigierte Abweichung verwendet. Bestimmen Sie anhand der sequenziellen Abweichung die Signifikanz der Terme entsprechend der Reihenfolge, in der sie in das Modell eingegeben werden.

Korrigiert (Typ III): Misst die Abnahme der Abweichung für jeden Term relativ zu einem Modell, das alle verbleibenden Terme enthält.
Sequenziell (Typ I): Misst die Abnahme der Abweichung, wenn ein Term einem Modell hinzugefügt wird, das lediglich die ihm vorhergehenden Terme enthält.

Anzahl der Gruppen für den Hosmer-Lemeshow-Test

Geben Sie die Anzahl der Gruppen für den Hosmer-Lemeshow-Test ein. Wenn Sie dieses Feld leer lassen, versucht Minitab, 10 gleich große Gruppen zu bilden. Zehn Gruppen sind für die meisten Datensätze gut geeignet.

Beim Hosmer-Lemeshow-Test handelt es sich um einen Test auf Güte der Anpassung, bei dem die Anpassung des Modells anhand eines Vergleichs der beobachteten und der erwarteten Häufigkeiten ausgewertet wird. Bei dem Test werden die Daten auf der Grundlage ihrer geschätzten Wahrscheinlichkeiten von der geringsten zur höchsten in Gruppen unterteilt, und dann wird ein Chi-Quadrat-Test durchgeführt, um zu ermitteln, ob sich die beobachteten und die erwarteten Häufigkeiten signifikant unterscheiden. Wenn die Anzahl der eindeutigen Faktoren-/Kovariatenmuster klein oder groß ist, empfiehlt es sich möglicherweise, die Anzahl der Gruppen zu ändern. Sie können z. B. weniger Gruppen verwenden, um die Anzahl der erwarteten Werte in den Gruppen zu erhöhen. Alternativ können Sie mehr Gruppen verwenden, um einen detaillierteren Vergleich der beobachteten und der erwarteten Werte zu erhalten. Hosmer und Lemeshow schlagen ein Minimum von 6 Gruppen vor¹.

¹ D. W. Hosmer und S. Lemeshow (2000). Applied Logistic Regression. 2nd Ed. John Wiley & Sons, Inc.