Interpretieren aller Statistiken für Nominale Logistische Regression

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken, die mit der nominalen logistischen Regressionsanalyse bereitgestellt werden.

Informationen zur Antwortvariablen

Minitab zeigt die folgenden Informationen zur Antwortvariablen an:
Variable
Name der Antwortvariablen
Wert
Stufen der Antwortvariablen
Anzahl
Anzahl der Beobachtungen auf jeder Stufe der Antwortvariablen
Gesamt
Anzahl der nicht fehlenden Beobachtungen

Das Ergebnis zeigt auch, bei welcher Stufe der Antwortvariablen es sich um das Referenzereignis handelt.

Interpretation

Verwenden Sie die Informationen zur Antwortvariablen, um zu untersuchen, wie viele Daten in der Analyse enthalten sind. Größere Zufallsstichproben mit zahlreichen Vorkommen jeder Stufe ermöglichen in der Regel genauere Rückschlüsse über die Grundgesamtheit.

Verwenden Sie die Informationen zur Antwortvariablen auch, um zu bestimmen, bei welchem Ereignis es sich um das Referenzereignis handelt. Die Interpretation der Statistiken, z. B. der Koeffizienten und Chancenverhältnisse, hängt davon ab, welches Ereignis das Referenzereignis ist.

Faktorinformationen

In der Tabelle „Faktorinformationen“ werden die Faktoren im Design, die Anzahl der Stufen sowie die Werte der Stufen angezeigt. Die Faktoren können nur eine begrenzte Anzahl von möglichen Werten annehmen; diese werden als Faktorstufen bezeichnet. Faktorstufen können numerische Daten oder Textdaten sein. Für numerische Faktoren werden nur wenige kontrollierte Werte im Experiment genutzt, selbst wenn diese viele Werte annehmen können.

Interpretation

Verwenden Sie die Tabelle „Faktorinformationen“, um die Anzahl der Stufen in der Analyse einzusehen. Ein Qualitätsanalytiker möchte beispielsweise die Faktoren untersuchen, die sich während des Fertigungsprozesses auf die Kunststofffestigkeit auswirken können. Der Analytiker bindet den Faktor „Zusatz“ ein. „Zusatz“ ist eine kategoriale Variable, die entweder vom Typ A oder vom Typ B sein kann.

Faktorinformationen

FaktorStufenWerte
Zusatz2A; B

Faktoren können gekreuzt oder geschachtelt sein. Zwei Faktoren sind gekreuzt, wenn jede Stufe eines Faktors in Kombination mit jeder Stufe des anderen Faktors auftritt. Zwei Faktoren sind geschachtelt, wenn eine Gruppe von Stufen für einen Faktor auf nur einer Stufe des zweiten Faktors auftritt. Wenn ein Design beispielsweise die Faktoren „Maschine“ und „Bediener“ enthält, sind diese gekreuzt, wenn alle Bediener an allen Maschinen arbeiten. „Bediener“ ist jedoch in „Maschine“ geschachtelt, wenn an jeder Maschine unterschiedliche Bediener arbeiten.

In der Tabelle „Faktorinformationen“ zeigen Klammern geschachtelte Faktoren an. „Standard(Prüfer)“ zeigt z. B. an, dass der Faktor „Standard“ innerhalb des Faktors „Prüfer“ geschachtelt ist. In diesem Kontext wird durch die Schachtelung angegeben, dass jeder Prüfer über einen eigenen Satz von Standardteilen verfügt. Die Faktorstufen eines geschachtelten Faktors werden für jede Stufe der Schachtelung wiederholt, wodurch sich die Anzahl der Stufen für den geschachtelten Faktor erhöht. In diesem Beispiel hat jeder Prüfer 5 Standards, aber weil „Standard“ in „Prüfer“ geschachtelt ist, weist „Standard“ 20 verschiedene Stufen auf.

Faktorinformationen

FaktorStufenWerte
Standard(Prüfer)201(Ahrens); 2(Ahrens); 3(Ahrens); 4(Ahrens); 5(Ahrens); 1(Becker);
2(Becker); 3(Becker); 4(Becker); 5(Becker); 1(Ernst); 2(Ernst);
3(Ernst); 4(Ernst); 5(Ernst); 1(Müller); 2(Müller); 3(Müller);
4(Müller); 5(Müller)
Prüfer4Ahrens; Becker; Ernst; Müller

Weitere Informationen zu Faktoren finden Sie unter Faktoren und Faktorstufen, Was sind Faktoren, gekreuzte Faktoren und geschachtelte Faktoren? und Wodurch unterscheiden sich feste Faktoren und Zufallsfaktoren?.

Koef

Bei der nominalen logistischen Gleichung wird jedes nominale Ergebnis separat behandelt. Die Gleichung für die logistische Regression besteht aus mehreren Logit-Funktionen, eine für jeden Wert der Antwortvariablen minus eins. Jede Gleichung weist eine eindeutige Steigung für die Prädiktoren auf. Mit diesen Gleichungen wird ausgewertet, wie sich die Wahrscheinlichkeit eines nominalen Ergebnisses in Bezug auf ein anderes nominales Ergebnis ändert, wenn sich die Prädiktorvariablen ändern.

Interpretation

Verwenden Sie die Koeffizienten, um zu untersuchen, wie sich die Wahrscheinlichkeit eines Ergebnisses bei einer Änderung der Prädiktorvariablen ändert. Der geschätzte Koeffizient für einen Prädiktor stellt die Änderung in der Linkfunktion bei einer Änderung des Prädiktors um eine Einheit dar, wenn die anderen Prädiktoren im Modell auf konstanten Werten gehalten werden. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit eines Ergebnisses hängt von verschiedenen Aspekten der Analyse ab, darunter das Referenzergebnis für die Antwortvariable und die Referenzstufen für die kategorialen Prädiktoren. Positive Koeffizienten führen in der Regel dazu, dass die Wahrscheinlichkeit für das Referenzergebnis bei einem zunehmenden Prädiktor sinkt. Negative Koeffizienten führen dazu, dass die Wahrscheinlichkeit für das Referenzergebnis bei einem zunehmenden Prädiktor steigt. Ein geschätzter Koeffizient nahe 0 weist darauf hin, dass der Effekt des Prädiktors gering ist.

Die Leiterin einer Schule möchte beispielsweise unterschiedliche Lehrmethoden untersuchen. Sie verwendet Alter und Lehrmethode, um zu prognostizieren, welche Fächer die Schüler bevorzugen. Das erste Ergebnis befindet sich in der Tabelle mit den Informationen zu der Antwortvariablen an erster Stelle; es ist das Referenzergebnis für die Antwortvariable. Für diese Daten ist das Referenzergebnis, dass die Schüler Sachkunde bevorzugen. Mit Logit 1 wird die Wahrscheinlichkeit verglichen, dass ein Schüler Mathematik gegenüber Sachkunde bevorzugt. In dieser Gleichung ist der p-Wert des Koeffizienten für Alter größer als 0,7. Ein so hoher p-Wert deutet darauf hin, dass das Alter geringe Auswirkungen darauf hat, ob ein Schüler Mathematik gegenüber Sachkunde bevorzugt.

Mit Logit 2 werden Kunst und Sachkunde verglichen. In dieser Gleichung ist der Koeffizient für das Alter größer als der Koeffizient, mit dem Mathematik mit Sachkunde verglichen wird. Der Koeffizient für das Alter ist positiv. Mit zunehmendem Alter der Schüler steigt die Wahrscheinlichkeit, dass sie Kunst gegenüber Sachkunde bevorzugen.

Die Interpretation der Koeffizienten für kategoriale Prädiktoren hängt von der Referenzstufe des Faktors ab. In den Daten zu den Lehrmethoden gibt es die beiden Stufen „Vorführen“ und „Erklären“ für die Lehrmethode. „Vorführen“ ist nicht in der Koeffiziententabelle enthalten, daher ist „Vorführen“ die Referenzstufe. In der Gleichung, mit der Mathematik und Sachkunde verglichen werden, ist der p-Wert für „Erklären“ größer als 0,5. Ein so hoher p-Wert deutet darauf hin, dass die Lehrmethode geringe Auswirkungen darauf hat, ob ein Schüler Mathematik gegenüber Sachkunde bevorzugt.

Bei Logit 2 ist der Koeffizient für „Erklären“ größer als der Koeffizient, mit dem Mathematik mit Sachkunde verglichen wird. Der p-Wert für diesen Koeffizienten ist kleiner als 0,05, dieser Koeffizient ist also auf dem Niveau 0,05 statistisch signifikant. Der Koeffizient für „Erklären“ in dieser Gleichung ist positiv. Wenn die Lehrmethode „Erklären“ ist, bevorzugt ein Schüler mit größerer Wahrscheinlichkeit Kunst.

Informationen zur Antwortvariablen

VariableWertAnzahl
LehrfachSachkunde10(Referenzereignis)
  Mathematik11 
  Kunst9 
  Gesamt30 

Faktorinformationen

FaktorStufenWerte
Lehrmethode2Vorführen; Erklären

Logistische Regressionstabelle

PrädiktorKoefSE KoefzpChancenverhältnis
Logit 1: (Mathematik/Sachkunde)         
Konstante-1,122664,56425-0,250,806 
Lehrmethode         
  Erklären-0,5631150,937591-0,600,5480,57
Alter0,1246740,4010790,310,7561,13
Logit 2: (Kunst/Sachkunde)         
Konstante-13,84857,24256-1,910,056 
Lehrmethode         
  Erklären2,769921,372092,020,04415,96
Alter1,013540,5844941,730,0832,76

95%-KI
PrädiktorUntergrenzeObergrenze
Logit 1: (Mathematik/Sachkunde)   
Konstante   
Lehrmethode   
  Erklären0,093,58
Alter0,522,49
Logit 2: (Kunst/Sachkunde)   
Konstante   
Lehrmethode   
  Erklären1,08234,90
Alter0,888,66
Log-Likelihood = -26,446

Test, dass alle Steigungen null sind

DFGp-Wert
412,8250,012

Tests auf Güte der Anpassung

MethodeChi-QuadratDFp
Pearson6,95295100,730
Abweichung7,88622100,640

SE Koef

Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.

Interpretation

Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.

z-Wert

Beim z-Wert handelt es sich um eine Teststatistik, mit der das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen wird.

Interpretation

Minitab verwendet den z-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der Test ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Koeffizienten der Stichprobe einer Normalverteilung folgt.

Ein hinreichend weit von 0 entfernter z-Wert weist darauf hin, dass der Schätzwert des Koeffizienten sowohl groß als auch genau genug ist, um sich statistisch von 0 zu unterscheiden. Ein z-Wert, der nahe bei 0 liegt, weist hingegen darauf hin, dass der Schätzwert des Koeffizienten zu klein oder zu ungenau ist, um sicher sein zu können, dass der Term eine Auswirkung auf die Antwortvariable hat.

p-Wert

Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.

Interpretation

Um zu bestimmen, ob die Assoziation zwischen der Antwortvariablen und jedem Term im Modell statistisch signifikant ist, vergleichen Sie den p-Wert für den Term mit dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass der Koeffizient des Terms gleich null ist, was bedeutet, dass keine Assoziation zwischen dem Term und der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 bedeutet ein Risiko, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist, von 5 %.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Term besteht. Es empfiehlt sich möglicherweise, dass Modell ohne den Term erneut anzupassen.
Wenn mehrere Prädiktoren ohne eine statistisch signifikante Assoziation mit der Antwortvariablen vorhanden sind, können Sie das Modell reduzieren, indem Sie Terme einzeln nacheinander entfernen. Weitere Informationen zum Entfernen von Termen aus dem Modell finden Sie unter Modellreduzierung.
Wenn ein Modellterm statistisch signifikant ist, hängt die Interpretation von der Art des Terms ab. Die Interpretationen lauten wie folgt:
  • Wenn ein stetiger Prädiktor signifikant ist, können Sie schlussfolgern, dass die Wahrscheinlichkeiten für die Stufe der Antwortvariablen vom Prädiktor abhängt.
  • Wenn ein kategorialer Prädiktor signifikant ist, können Sie schlussfolgern, dass die Stufen der Antwortvariablen auf dieser Stufe des Faktors eine andere Vorkommenswahrscheinlichkeit als auf der Referenzstufe des Faktors aufweisen.
  • Wenn ein Wechselwirkungsterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und den Wahrscheinlichkeiten für die Stufe der Antwortvariablen von den anderen Prädiktoren im Term abhängt.
  • Wenn ein Polynomialterm signifikant ist, können Sie schlussfolgern, dass die Beziehung zwischen einem Prädiktor und den Wahrscheinlichkeiten für die Stufe der Antwortvariablen von der Größe des Prädiktors abhängt.

Chancenverhältnis

Mit dem Chancenverhältnis werden die Chancen von zwei Ergebnissen verglichen. Die Chancen eines Ergebnisses entsprechen der Wahrscheinlichkeit, dass das Vergleichsergebnis eintritt, geteilt durch die Wahrscheinlichkeit, dass das Referenzergebnis eintritt.

Interpretation

Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen kategorialen oder einen stetigen Prädiktor handelt. In der logistischen Regressionstabelle ist das Vergleichsergebnis das erste Ergebnis nach der „Logit“-Beschriftung, und das Referenzergebnis ist das zweite. Das Referenzergebnis ist für alle Logits gleich.

Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnisse größer als 1 weisen darauf hin, dass das Vergleichsergebnis mit zunehmenden Prädiktorwerten kontinuierlich wahrscheinlicher als das Referenzergebnis wird. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Referenzergebnis wahrscheinlicher als das Vergleichsergebnis ist.

Die Leiterin einer Schule möchte beispielsweise unterschiedliche Lehrmethoden untersuchen. Für Logit 1 ist das Vergleichsergebnis Mathematik. Für Logit 2 ist das Vergleichsergebnis Kunst. Das Referenzergebnis ist Sachkunde. Bei Logit 2 beträgt der Schätzwert des Chancenverhältnisses 2,76, ist also größer als 1. Mit zunehmendem Alter steigt die Wahrscheinlichkeit, dass die Schüler Kunst gegenüber Sachkunde bevorzugen. Mit jedem weiteren Jahr ist die Chance, dass die Schüler Kunst bevorzugen, dreimal größer als die Chance, dass sie Sachkunde bevorzugen.

Logistische Regressionstabelle

PrädiktorKoefSE KoefzpChancenverhältnis
Logit 1: (Mathematik/Sachkunde)         
Konstante-1,122664,56425-0,250,806 
Lehrmethode         
  Erklären-0,5631150,937591-0,600,5480,57
Alter0,1246740,4010790,310,7561,13
Logit 2: (Kunst/Sachkunde)         
Konstante-13,84857,24256-1,910,056 
Lehrmethode         
  Erklären2,769921,372092,020,04415,96
Alter1,013540,5844941,730,0832,76

95%-KI
PrädiktorUntergrenzeObergrenze
Logit 1: (Mathematik/Sachkunde)   
Konstante   
Lehrmethode   
  Erklären0,093,58
Alter0,522,49
Logit 2: (Kunst/Sachkunde)   
Konstante   
Lehrmethode   
  Erklären1,08234,90
Alter0,888,66

Chancenverhältnisse für kategoriale Prädiktoren

Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Vergleichsergebnis auf zwei verschiedenen Stufen des Prädiktors. Die Vergleichsstufe befindet sich in der logistischen Regressionstabelle und weist ein geschätztes Chancenverhältnis auf. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Vergleichsergebnis gegenüber dem Referenzergebnis wahrscheinlicher wird, wenn sich der kategoriale Prädiktor von der Referenzstufe auf die Vergleichsstufe ändert. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Vergleichsergebnis gegenüber dem Referenzergebnis weniger wahrscheinlich wird, wenn sich der kategoriale Prädiktor von der Referenzstufe auf die Vergleichsstufe ändert.

Die Leiterin einer Schule möchte beispielsweise unterschiedliche Lehrmethoden untersuchen. Für Logit 1 ist das Vergleichsergebnis Mathematik. Für Logit 2 ist das Vergleichsergebnis Kunst. Das Referenzergebnis ist Sachkunde. Bei Logit 2 beträgt der Schätzwert des Chancenverhältnisses für die Lehrmethode 15,96, ist also größer als 1. Wenn sich die Lehrmethode von „Vorführen“ auf „Erklären“ ändert, sind die Chancen, dass Schüler Kunst bevorzugen, ungefähr 16 Mal größer als die Chancen, dass sie Sachkunde bevorzugen.

Logistische Regressionstabelle

PrädiktorKoefSE KoefzpChancenverhältnis
Logit 1: (Mathematik/Sachkunde)         
Konstante-1,122664,56425-0,250,806 
Lehrmethode         
  Erklären-0,5631150,937591-0,600,5480,57
Alter0,1246740,4010790,310,7561,13
Logit 2: (Kunst/Sachkunde)         
Konstante-13,84857,24256-1,910,056 
Lehrmethode         
  Erklären2,769921,372092,020,04415,96
Alter1,013540,5844941,730,0832,76

95%-KI
PrädiktorUntergrenzeObergrenze
Logit 1: (Mathematik/Sachkunde)   
Konstante   
Lehrmethode   
  Erklären0,093,58
Alter0,522,49
Logit 2: (Kunst/Sachkunde)   
Konstante   
Lehrmethode   
  Erklären1,08234,90
Alter0,888,66

Konfidenzintervall für Chancenverhältnis (95%-KI)

Diese Konfidenzintervalle (KI) sind Bereiche von Werten, die wahrscheinlich die tatsächlichen Werte der Chancenverhältnisse enthalten. Die Konfidenzintervalle werden auf der Grundlage der Normalverteilung berechnet. Das Konfidenzintervall ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Chancenverhältnisse der Stichprobe einer Normalverteilung folgt.

Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.

Das Konfidenzintervall setzt sich aus den folgenden zwei Teilen zusammen:
Punktschätzung
Die Punktschätzung ist der Schätzwert des Parameters, der auf der Grundlage der Stichprobendaten berechnet wird.
Fehlerspanne
Die Fehlerspanne definiert die Breite des Konfidenzintervalls, und sie wird durch die Spannweite der Ereigniswahrscheinlichkeiten, den Stichprobenumfang und das Konfidenzniveau bestimmt.

Interpretation

Verwenden Sie das Konfidenzintervall, um den Schätzwert des Chancenverhältnisses zu beurteilen.

Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Chancenverhältnisses für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.

Test für Terme mit mehr als 1 Freiheitsgrad

Bei diesem Test handelt es sich um einen Gesamttest, der alle Koeffizienten für einen kategorialen Prädiktor gleichzeitig berücksichtigt. Er ist für kategoriale Prädiktoren mit mehr als 2 Stufen vorgesehen.

Interpretation

Verwenden Sie diesen Test, um zu bestimmen, ob ein kategorialer Prädiktor mit mehr als einem Koeffizienten eine statistisch signifikante Beziehung zu den Ereignissen der Antwortvariablen aufweist. Wenn ein kategorialer Prädiktor mehr als zwei Stufen umfasst, weisen die Koeffizienten für die einzelnen Stufen unterschiedliche p-Werte auf. Der Gesamttest liefert genau eine Antwort auf die Frage, ob der Prädiktor statistisch signifikant ist.

Um zu bestimmen, ob die Assoziation zwischen den Ereignissen der Antwortvariablen und dem kategorialen Prädiktor statistisch signifikant ist, vergleichen Sie den p-Wert für den Test mit dem dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass keine Assoziation zwischen dem Prädiktor und den Ereignissen der Antwortvariablen besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Prädiktor besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und dem Prädiktor besteht.

Log-Likelihood

Minitab maximiert die Log-Likelihood-Funktion, um optimale Werte für die geschätzten Koeffizienten zu berechnen.

Interpretation

Verwenden Sie die Log-Likelihood, um zwei Modelle zu vergleichen, bei denen zum Schätzen der Koeffizienten dieselben Daten genutzt werden. Da die Werte negativ sind, ist das Modell umso besser an die Daten angepasst, je näher der Wert an 0 liegt.

Die Log-Likelihood kann nicht abnehmen, wenn Sie einem Modell Terme hinzufügen. Ein Modell mit 5 Termen weist z. B. eine höhere Log-Likelihood als jedes Modell mit 4 Termen auf, das Sie anhand derselben Terme erstellen können. Die Log-Likelihood ist daher am nützlichsten, wenn Sie Modelle derselben Größe vergleichen. Um Entscheidungen über einzelne Terme zu treffen, verwenden Sie in der Regel die p-Werte für den Term in den verschiedenen Logits.

Test, dass alle Steigungen null sind

Bei diesem Test handelt es sich um einen Gesamttest, der alle Koeffizienten für die Prädiktoren im Modell berücksichtigt.

Interpretation

Verwenden Sie diesen Test, um zu bestimmen, ob mindestens ein Prädiktor im Modell eine statistisch signifikante Assoziation mit den Ereignissen der Antwortvariablen aufweist. In der Regel werden die G-Statistik und die Freiheitsgrade (DF) nicht interpretiert. Die DF entsprechen der Anzahl der Koeffizienten für die Prädiktoren im Modell.

Um zu bestimmen, ob die Assoziation zwischen den Ereignissen der Antwortvariablen und den Prädiktoren statistisch signifikant ist, vergleichen Sie den p-Wert für den Test mit dem dem Signifikanzniveau, um die Nullhypothese auszuwerten. Die Nullhypothese besagt, dass alle Koeffizienten für die Prädiktoren im Modell gleich null sind, was darauf hinweist, dass zwischen den Ereignissen der Antwortvariablen und den Prädiktoren keine Assoziation besteht. In der Regel ist ein Signifikanzniveau (als α oder Alpha bezeichnet) von 0,05 gut geeignet. Ein Signifikanzniveau von 0,05 gibt ein Risiko von 5 % an, dass auf eine vorhandene Assoziation geschlossen wird, während tatsächlich keine vorhanden ist.
p-Wert ≤ α: Die Assoziation ist statistisch signifikant
Wenn der p-Wert kleiner oder gleich dem Signifikanzniveau ist, können Sie schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und mindestens einem Prädiktor besteht.
p-Wert > α: Die Assoziation ist statistisch nicht signifikant
Wenn der p-Wert größer als das Signifikanzniveau ist, können Sie nicht schlussfolgern, dass eine statistisch signifikante Assoziation zwischen der Antwortvariablen und mindestens einem der Terme besteht.

Pearson-Test auf Güte der Anpassung

Beim Pearson-Test auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die von der multinomialen Verteilung nicht prognostiziert wird. Der Test ist nicht hilfreich, wenn die Anzahl eindeutiger Werte ungefähr der Anzahl der Beobachtungen entspricht, aber er ist nützlich, wenn mehrere Beobachtungen mit denselben Werten für die Prädiktoren vorliegen. Wenn der p-Wert des Tests auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die von der multinomialen Verteilung nicht prognostiziert wird. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist

Abweichungstest auf Güte der Anpassung

Beim Abweichungstest auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.

Interpretation

Verwenden Sie die Tests auf Güte der Anpassung, um zu ermitteln, ob die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten abweichen, die von der multinomialen Verteilung nicht prognostiziert wird. Der Test ist nicht hilfreich, wenn die Anzahl eindeutiger Werte ungefähr der Anzahl der Beobachtungen entspricht, aber er ist nützlich, wenn mehrere Beobachtungen mit denselben Werten für die Prädiktoren vorliegen. Wenn der p-Wert des Tests auf Güte der Anpassung kleiner als das ausgewählte Signifikanzniveau ist, weichen die prognostizierten Wahrscheinlichkeiten auf eine Weise von den beobachteten Wahrscheinlichkeiten ab, die von der multinomialen Verteilung nicht prognostiziert wird. In der folgenden Liste finden Sie häufige Ursachen für die Abweichung:
  • Fehlender Term höherer Ordnung für Variablen im Modell
  • Fehlender Prädiktor, der nicht im Modell enthalten ist