Mit der ordinalen logistischen Regression wird für jeden Term im Modell ein Koeffizient geschätzt. Die Koeffizienten für die Terme im Modell sind für alle Ergebniskategorien gleich.
Mit der ordinalen logistischen Regression wird außerdem für alle Ergebniskategorien bis auf eine ein Koeffizient für die Konstante geschätzt. Die Koeffizienten für die Konstanten bilden zusammen mit den Koeffizienten für die Variablen eine Gruppe von Gleichungen der binären Regression. Mit der ersten Gleichung wird die Wahrscheinlichkeit geschätzt, dass das erste Ereignis eintritt. Mit der zweiten Gleichung wird die Wahrscheinlichkeit geschätzt, dass das erste oder zweite Ereignis eintritt. Mit der dritten Gleichung wird die Wahrscheinlichkeit geschätzt, dass das erste, zweite oder dritte Ereignis eintritt usw. Minitab beschriftet diese Koeffizienten für Konstanten mit „Konst(1)“, „Konst(2)“, „Konst(3)“ usw.
Verwenden Sie die Koeffizienten, um zu untersuchen, wie sich die Wahrscheinlichkeit eines Ergebnisses bei einer Änderung der Prädiktorvariablen ändert. Der geschätzte Koeffizient für einen Prädiktor stellt die Änderung in der Linkfunktion bei einer Änderung des Prädiktors um eine Einheit dar, wenn die anderen Prädiktoren im Modell auf konstanten Werten gehalten werden. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit eines Ergebnisses hängt von verschiedenen Aspekten der Analyse ab, einschließlich der Linkfunktion, der Reihenfolge der Kategorien der Antwortvariablen und der Referenzstufen für kategoriale Prädiktoren, die im Modell enthalten sind. Positive Koeffizienten führen in der Regel dazu, dass das erste Ereignis und die Ereignisse, die näher an diesem ersten Ereignis liegen, mit umso größerer Wahrscheinlichkeit eintreten, je größer der Prädiktor ist. Negative Koeffizienten führen dazu, dass das letzte Ereignis und die Ereignisse, die näher an diesem letzten Ereignis liegen, mit umso größerer Wahrscheinlichkeit eintreten, je größer der Prädiktor ist. Ein geschätzter Koeffizient nahe 0 bedeutet, dass der Effekt des Prädiktors gering ist.
In der Analyse einer Umfrage zur Patientenzufriedenheit wird beispielsweise untersucht, welche Beziehung zwischen der vom Patienten zurückgelegten Entfernung und der Rückkehrwahrscheinlichkeit des Patienten besteht. Das erste Ereignis befindet sich in der Tabelle mit den Informationen zur Antwortvariablen an erster Stelle. In diesem Fall ist das erste Ereignis „Sehr wahrscheinlich“, das letzte Ereignis „Unwahrscheinlich“. Der negative Koeffizient für die Entfernung zeigt, dass die Patienten bei zunehmender Entfernung mit größerer Wahrscheinlichkeit „Unwahrscheinlich“ antworten.
Variable | Wert | Anzahl |
---|---|---|
Folgeuntersuchung | Sehr wahrscheinlich | 19 |
Etwas wahrscheinlich | 43 | |
Unwahrscheinlich | 11 | |
Gesamt | 73 |
95%-KI | |||||||
---|---|---|---|---|---|---|---|
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis | Untergrenze | Obergrenze |
Konst(1) | -0,505898 | 0,938791 | -0,54 | 0,590 | |||
Konst(2) | 2,27788 | 0,985924 | 2,31 | 0,021 | |||
Entfernung | -0,0470551 | 0,0797374 | -0,59 | 0,555 | 0,95 | 0,82 | 1,12 |
Bei kategorialen Prädiktoren handelt es sich um die Änderung von der Referenzstufe zu der in der logistischen Regressionstabelle aufgeführten Stufe des Prädiktors. Positive Koeffizienten weisen in der Regel darauf hin, dass das erste Ereignis auf der in der logistischen Regressionstabelle aufgeführten Stufe des Faktors wahrscheinlicher als auf der Referenzstufe des Faktors ist. Negative Koeffizienten weisen darauf hin, dass das letzte Ereignis auf der in der logistischen Regressionstabelle aufgeführten Stufe des Faktors wahrscheinlicher als auf der Referenzstufe des Faktors ist.
In der Analyse einer Umfrage zur Patientenzufriedenheit wird beispielsweise untersucht, welche Beziehung zwischen dem Beschäftigungsstatus eines Patienten und der Rückkehrwahrscheinlichkeit des Patienten besteht. Das erste Ereignis ist „Sehr wahrscheinlich“, das letzte Ereignis „Unwahrscheinlich“. Der Beschäftigungsstatus kann „Arbeitslos“ oder „In Beschäftigung“ sein. Die nicht in der logistischen Regressionstabelle enthaltene Referenzstufe des Prädiktors lautet „In Beschäftigung“. Der negative Koeffizient für die Stufe „Arbeitslos“ weist darauf hin, dass arbeitslose Patienten mit größerer Wahrscheinlichkeit „Unwahrscheinlich“ als in Beschäftigung stehende Patienten antworten.
Variable | Wert | Anzahl |
---|---|---|
Folgeuntersuchung | Sehr wahrscheinlich | 19 |
Etwas wahrscheinlich | 43 | |
Unwahrscheinlich | 11 | |
Gesamt | 73 |
95%-KI | ||||||
---|---|---|---|---|---|---|
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis | Untergrenze |
Konst(1) | -0,707512 | 0,352815 | -2,01 | 0,045 | ||
Konst(2) | 2,12316 | 0,444672 | 4,77 | 0,000 | ||
Beschäftigungsstatus | ||||||
Arbeitslos | -0,631468 | 0,471078 | -1,34 | 0,180 | 0,53 | 0,21 |
95%-KI | |
---|---|
Prädiktor | Obergrenze |
Konst(1) | |
Konst(2) | |
Beschäftigungsstatus | |
Arbeitslos | 1,34 |
Die Koeffizienten für die Konstanten werden mit den Termen für die Prädiktoren kombiniert, um Wahrscheinlichkeiten zu schätzen. Minitab kann diese Wahrscheinlichkeiten für Beobachtungen im Arbeitsblatt speichern, wenn Sie die Analyse ausführen. Weitere Informationen finden Sie unter Speichern von Statistiken für Ordinale Logistische Regression.
Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.
Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.
Beim z-Wert handelt es sich um eine Teststatistik, mit der das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen wird.
Minitab verwendet den z-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der Test ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Koeffizienten der Stichprobe einer Normalverteilung folgt.
Ein hinreichend weit von 0 entfernter z-Wert weist darauf hin, dass der Schätzwert des Koeffizienten sowohl groß als auch genau genug ist, um sich statistisch von 0 zu unterscheiden. Ein z-Wert, der nahe bei 0 liegt, weist hingegen darauf hin, dass der Schätzwert des Koeffizienten zu klein oder zu ungenau ist, um sicher sein zu können, dass der Term eine Auswirkung auf die Antwortvariable hat.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Mit dem Chancenverhältnis werden die Chancen von zwei Ereignissen verglichen. Die Chancen eines Ereignisses entsprechen der Wahrscheinlichkeit, dass das Ereignis eintritt, geteilt durch die Wahrscheinlichkeit, dass das Ereignis nicht eintritt. Minitab berechnet Chancenverhältnisse, wenn das Modell die Logit-Linkfunktion verwendet.
Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen stetigen oder einen kategorialen Prädiktor handelt.
Chancenverhältnisse größer als 1 weisen darauf hin, dass das erste Ereignis und die Ereignisse, die näher an diesem ersten Ereignis liegen, mit umso größerer Wahrscheinlichkeit eintreten, je größer der Prädiktor ist. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das letzte Ereignis und die Ereignisse, die näher an diesem letzten Ereignis liegen, mit umso größerer Wahrscheinlichkeit eintreten, je größer der Prädiktor ist.
In der Analyse einer Umfrage zur Patientenzufriedenheit wird beispielsweise untersucht, welche Beziehung zwischen der vom Patienten zurückgelegten Entfernung und der Rückkehrwahrscheinlichkeit des Patienten besteht. Das erste Ereignis befindet sich in der Tabelle mit den Informationen zur Antwortvariablen an erster Stelle. In diesem Fall ist das erste Ereignis „Sehr wahrscheinlich“, das letzte Ereignis „Unwahrscheinlich“. Das Chancenverhältnis von 0,95 für die Entfernung zeigt, dass die Wahrscheinlichkeit, mit der Patienten mit „Unwahrscheinlich“ antworten, mit zunehmender Entfernung steigt. Mit jeder Meile, die der Patient zusätzlich zurücklegt, sinkt die Chance, dass er mit „Sehr wahrscheinlich“ statt „Etwas wahrscheinlich“ oder „Unwahrscheinlich“ antwortet, um 5 %.
Variable | Wert | Anzahl |
---|---|---|
Folgeuntersuchung | Sehr wahrscheinlich | 19 |
Etwas wahrscheinlich | 43 | |
Unwahrscheinlich | 11 | |
Gesamt | 73 |
95%-KI | |||||||
---|---|---|---|---|---|---|---|
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis | Untergrenze | Obergrenze |
Konst(1) | -0,505898 | 0,938791 | -0,54 | 0,590 | |||
Konst(2) | 2,27788 | 0,985924 | 2,31 | 0,021 | |||
Entfernung | -0,0470551 | 0,0797374 | -0,59 | 0,555 | 0,95 | 0,82 | 1,12 |
Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Eintreten des Ereignisses auf zwei verschiedenen Stufen des Prädiktors. Chancenverhältnisse größer als 1 weisen darauf hin, dass das erste Ereignis und die Ereignisse, die näher an diesem ersten Ereignis liegen, auf der in der logistischen Regressionstabelle aufgeführten Stufe des Prädiktors wahrscheinlicher als auf der Referenzstufe des Prädiktors sind. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das letzte Ereignis und die Ereignisse, die näher an diesem letzten Ereignis liegen, auf der in der logistischen Regressionstabelle aufgeführten Stufe des Prädiktors wahrscheinlicher als auf der Referenzstufe des Prädiktors sind.
In der Analyse einer Umfrage zur Patientenzufriedenheit wird beispielsweise untersucht, welche Beziehung zwischen dem Beschäftigungsstatus eines Patienten und der Rückkehrwahrscheinlichkeit des Patienten besteht. Das erste Ereignis ist „Sehr wahrscheinlich“, das letzte Ereignis „Unwahrscheinlich“. Der Beschäftigungsstatus kann „Arbeitslos“ oder „In Beschäftigung“ sein. Die nicht in der logistischen Regressionstabelle enthaltene Referenzstufe des Prädiktors lautet „In Beschäftigung“. Das Chancenverhältnis ist kleiner als 1, ein in Beschäftigung stehender Patient antwortet also mit größerer Wahrscheinlichkeit, dass er „Sehr wahrscheinlich“ zurückkehrt, als ein arbeitsloser Patient. Die Chance, dass ein arbeitsloser Patient mit „Sehr wahrscheinlich“ statt „Etwas wahrscheinlich“ oder „Unwahrscheinlich“ antwortet, liegt bei 53 % der Chance, dass ein beschäftigter Patient mit „Sehr wahrscheinlich“ antwortet. Die Chance, dass ein arbeitsloser Patient mit „Sehr wahrscheinlich“ oder „Etwas wahrscheinlich“ statt „Unwahrscheinlich“ antwortet, liegt ebenfalls bei 53 % der Chance, dass ein in Beschäftigung stehender Patient mit „Sehr wahrscheinlich“ oder „Etwas wahrscheinlich“ antwortet.
Variable | Wert | Anzahl |
---|---|---|
Folgeuntersuchung | Sehr wahrscheinlich | 19 |
Etwas wahrscheinlich | 43 | |
Unwahrscheinlich | 11 | |
Gesamt | 73 |
95%-KI | ||||||
---|---|---|---|---|---|---|
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis | Untergrenze |
Konst(1) | -0,707512 | 0,352815 | -2,01 | 0,045 | ||
Konst(2) | 2,12316 | 0,444672 | 4,77 | 0,000 | ||
Beschäftigungsstatus | ||||||
Arbeitslos | -0,631468 | 0,471078 | -1,34 | 0,180 | 0,53 | 0,21 |
95%-KI | |
---|---|
Prädiktor | Obergrenze |
Konst(1) | |
Konst(2) | |
Beschäftigungsstatus | |
Arbeitslos | 1,34 |
Bei Chancenverhältnissen wird die Reihenfolge der Kategorien berücksichtigt; die Verhältnisse beschreiben also nicht, wie sich die Chancen für Kategorien ändern, die außerhalb der Reihenfolge liegen. Das Chancenverhältnis beschreibt z. B. nicht die Änderung der Chance, dass der Patient mit „Etwas wahrscheinlich“ statt „Sehr wahrscheinlich“ oder „Unwahrscheinlich“ antwortet. Um Kategorien in zufälliger Reihenfolge zu modellieren, verwenden Sie die nominale logistische Regression.
Diese Konfidenzintervalle (KI) sind Bereiche von Werten, die wahrscheinlich die tatsächlichen Werte der Chancenverhältnisse enthalten. Die Konfidenzintervalle werden auf der Grundlage der Normalverteilung berechnet. Das Konfidenzintervall ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Chancenverhältnisse der Stichprobe einer Normalverteilung folgt.
Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.
Verwenden Sie das Konfidenzintervall, um den Schätzwert des Chancenverhältnisses zu beurteilen.
Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Chancenverhältnisses für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.
Bei diesem Test handelt es sich um einen Gesamttest, der alle Koeffizienten für einen kategorialen Prädiktor gleichzeitig berücksichtigt. Er ist für kategoriale Prädiktoren mit mehr als 2 Stufen vorgesehen.
Verwenden Sie diesen Test, um zu bestimmen, ob ein kategorialer Prädiktor mit mehr als einem Koeffizienten eine statistisch signifikante Beziehung zu den Ereignissen der Antwortvariablen aufweist. Wenn ein kategorialer Prädiktor mehr als zwei Stufen umfasst, weisen die Koeffizienten für die einzelnen Stufen unterschiedliche p-Werte auf. Der Gesamttest liefert genau eine Antwort auf die Frage, ob der Prädiktor statistisch signifikant ist.
Minitab maximiert die Log-Likelihood-Funktion, um optimale Werte für die geschätzten Koeffizienten zu berechnen.
Verwenden Sie die Log-Likelihood, um zwei Modelle zu vergleichen, bei denen zum Schätzen der Koeffizienten dieselben Daten genutzt werden. Da die Werte negativ sind, ist das Modell umso besser an die Daten angepasst, je näher der Wert an 0 liegt.
Die Log-Likelihood kann nicht abnehmen, wenn Sie einem Modell Terme hinzufügen. Ein Modell mit 5 Termen weist z. B. eine höhere Log-Likelihood als jedes Modell mit 4 Termen auf, das Sie anhand derselben Terme erstellen können. Die Log-Likelihood ist daher am nützlichsten, wenn Sie Modelle derselben Größe vergleichen. Um Entscheidungen über einzelne Terme zu treffen, verwenden Sie in der Regel die p-Werte für den Term in den verschiedenen Logits.
Bei diesem Test handelt es sich um einen Gesamttest, der alle Koeffizienten für die Prädiktoren im Modell berücksichtigt.
Verwenden Sie diesen Test, um zu bestimmen, ob mindestens ein Prädiktor im Modell eine statistisch signifikante Assoziation mit den Ereignissen der Antwortvariablen aufweist. In der Regel werden die G-Statistik und die Freiheitsgrade (DF) nicht interpretiert. Die DF entsprechen der Anzahl der Koeffizienten für die Prädiktoren im Modell.