Methoden und Formeln für die Varianzanalyse in Binäres logistisches Modell anpassen

Wählen Sie die gewünschte Methode oder Formel aus.

Varianzanalyse

Die Abweichung ist ein Maß für die Unterschiede zwischen dem aktuellen Modell und dem vollständigen Modell. Bei dem vollständigen Modell handelt es sich um ein Modell mit n Parametern, einen Parameter pro Beobachtung. Das vollständige Modell maximiert die Log-Likelihood-Funktion. Es liefert einen Anhaltspunkt für Vergleiche von Modellen mit weniger als n Parametern. Bei Vergleichen mit dem vollständigen Modell wird die skalierte Abweichung verwendet.

Der Beitrag der einzelnen Datenpunkte zur skalierten Abweichung hängt vom Modell ab.

Modell Abweichung
Binomial
Poisson

Die Abweichungstabelle wird auf der Grundlage des folgenden allgemeinen Ergebnisses erstellt, bei dem angenommen wird, dass ϕ bekannt ist. Wenn DI die einem Anfangsmodell zugeordnete Abweichung und DS die einer Teilmenge von Termen im Anfangsmodell zugeordnete Abweichung ist, liegt unter einigen Regularitätsbedingungen die folgende Beziehung vor:

Die Differenz zwischen den Abweichungen ist asymptotisch als Chi-Quadrat-Verteilung mit d Freiheitsgraden verteilt. Diese Statistiken werden für die korrigierte Analyse (Typ III) und die sequenzielle Analyse (Typ I) berechnet. Die korrigierte Abweichung und die Chi-Quadrat-Statistik in der Abweichungstabelle sind gleich. Die korrigierte mittlere Abweichung ist die korrigierte Abweichung dividiert durch die Freiheitsgrade.

Bei der sequenziellen Analyse hängt das Ergebnis von der Reihenfolge ab, in der die Prädiktoren in das Modell eingegeben werden. Die sequenzielle Abweichung ist der eindeutige Teil der Abweichung, der durch einen Prädiktor erklärt wird, wenn bereits Prädiktoren im Modell vorhanden sind. Bei einem Modell mit den drei Prädiktoren X1, X2 und X3 zeigt die sequenzielle Abweichung für X3, wie viel der verbleibenden Abweichung durch X3 erklärt wird, wenn X1 und X2 bereits im Modell enthalten sind. Um eine andere sequenzielle Abweichung zu erhalten, wiederholen Sie das Regressionsverfahren, und geben Sie die Prädiktoren in einer anderen Reihenfolge ein.

Wenn ϕ unbekannt ist, zum Beispiel bei Antwortvariablen, die einer Normalverteilung folgen, ändert sich die Beziehung unter einigen Regularitätsbedingungen wie folgt:

Hier ist die Differenz zwischen den Abweichungen asymptotisch als F-Verteilung mit d Freiheitsgraden für den Zähler und np Freiheitsgraden für den Nenner verteilt. Um den Streuungsparameter zu schätzen, verwenden Sie das Anfangsmodell.

Notation

BegriffBeschreibung
yiAnzahl der Ereignisse für die i-te Zeile
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile
miAnzahl der Versuche für die i-te Zeile
LfLog-Likelihood des vollständigen Modells
LcLog-Likelihood des Modells mit einer Teilmenge von Termen aus dem vollständigen Modell
dFreiheitsgrade; die Differenz zwischen der Anzahl der Parameter in den zu vergleichenden Modellen
ϕStreuungsparameter, der als 1 für die Binomial- und Poisson-Modelle bekannt ist
nAnzahl der Zeilen in den Daten
pFreiheitsgrade der Regression für das Anfangsmodell

Freiheitsgrade (DF)

Gibt die Anzahl der unabhängigen Einzelinformationen in Bezug auf die Daten der Antwortvariablen an, die zur Berechnung der korrigierten Abweichungen vom Mittelwert benötigt werden. Die Freiheitsgrade für jede Komponente des Modells werden wie folgt ausgedrückt:
Streuungsquelle DF
Regression p
Fehler np − 1
Gesamt n − 1
Stetige Prädiktoren 1
Kategoriale Prädiktoren q − 1

Notation

BegriffBeschreibung
pSumme der Freiheitsgrade für die Prädiktoren. Die Prädiktoren umfassen nicht die Konstante.
nAnzahl der Beobachtungen im Datensatz
qAnzahl der Stufen des kategorialen Prädiktors

Log-Likelihood

Die Log-Likelihood-Funktionen sind in Bezug auf die Mittelwerte parametrisiert. Die allgemeine Form der Funktionen lautet:

Die allgemeine Form der einzelnen Beiträge lautet:

Die spezifische Form der einzelnen Beiträge hängt vom Modell ab.

Modell li
Binomial
Poisson

Notation

BegriffBeschreibung
yiAnzahl der Ereignisse für die i-te Zeile
miAnzahl der Versuche für die i-te Zeile
geschätzter Mittelwert der Antwortvariablen für die i-te Zeile

p-Wert (p)

p-Werte werden in Hypothesentests verwendet, um Ihnen die Entscheidung zu ermöglichen, ob eine Nullhypothese zurückgewiesen oder nicht zurückgewiesen werden sollte. Der p-Wert stellt die Wahrscheinlichkeit dar, eine Teststatistik zu erhalten, die mindestens so extrem wie der tatsächlich berechnete Wert ist, wenn die Nullhypothese wahr ist. Ein häufig verwendeter Trennwert für den p-Wert ist 0,05. Wenn beispielsweise der berechnete p-Wert einer Teststatistik kleiner als 0,05 ist, weisen Sie die Nullhypothese zurück.