Das Ergebnis zeigt auch, bei welcher Stufe der Antwortvariablen es sich um das Referenzereignis handelt.
Verwenden Sie die Informationen zur Antwortvariablen, um zu untersuchen, wie viele Daten in der Analyse enthalten sind. Größere Zufallsstichproben mit zahlreichen Vorkommen jeder Stufe ermöglichen in der Regel genauere Rückschlüsse über die Grundgesamtheit.
Verwenden Sie die Informationen zur Antwortvariablen auch, um zu bestimmen, bei welchem Ereignis es sich um das Referenzereignis handelt. Die Interpretation der Statistiken, z. B. der Koeffizienten und Chancenverhältnisse, hängt davon ab, welches Ereignis das Referenzereignis ist.
In der Tabelle „Faktorinformationen“ werden die Faktoren im Design, die Anzahl der Stufen sowie die Werte der Stufen angezeigt. Die Faktoren können nur eine begrenzte Anzahl von möglichen Werten annehmen; diese werden als Faktorstufen bezeichnet. Faktorstufen können numerische Daten oder Textdaten sein. Für numerische Faktoren werden nur wenige kontrollierte Werte im Experiment genutzt, selbst wenn diese viele Werte annehmen können.
Verwenden Sie die Tabelle „Faktorinformationen“, um die Anzahl der Stufen in der Analyse einzusehen. Ein Qualitätsanalytiker möchte beispielsweise die Faktoren untersuchen, die sich während des Fertigungsprozesses auf die Kunststofffestigkeit auswirken können. Der Analytiker bindet den Faktor „Zusatz“ ein. „Zusatz“ ist eine kategoriale Variable, die entweder vom Typ A oder vom Typ B sein kann.
Faktor | Stufen | Werte |
---|---|---|
Zusatz | 2 | A; B |
Faktoren können gekreuzt oder geschachtelt sein. Zwei Faktoren sind gekreuzt, wenn jede Stufe eines Faktors in Kombination mit jeder Stufe des anderen Faktors auftritt. Zwei Faktoren sind geschachtelt, wenn eine Gruppe von Stufen für einen Faktor auf nur einer Stufe des zweiten Faktors auftritt. Wenn ein Design beispielsweise die Faktoren „Maschine“ und „Bediener“ enthält, sind diese gekreuzt, wenn alle Bediener an allen Maschinen arbeiten. „Bediener“ ist jedoch in „Maschine“ geschachtelt, wenn an jeder Maschine unterschiedliche Bediener arbeiten.
In der Tabelle „Faktorinformationen“ zeigen Klammern geschachtelte Faktoren an. „Standard(Prüfer)“ zeigt z. B. an, dass der Faktor „Standard“ innerhalb des Faktors „Prüfer“ geschachtelt ist. In diesem Kontext wird durch die Schachtelung angegeben, dass jeder Prüfer über einen eigenen Satz von Standardteilen verfügt. Die Faktorstufen eines geschachtelten Faktors werden für jede Stufe der Schachtelung wiederholt, wodurch sich die Anzahl der Stufen für den geschachtelten Faktor erhöht. In diesem Beispiel hat jeder Prüfer 5 Standards, aber weil „Standard“ in „Prüfer“ geschachtelt ist, weist „Standard“ 20 verschiedene Stufen auf.
Faktor | Stufen | Werte |
---|---|---|
Standard(Prüfer) | 20 | 1(Ahrens); 2(Ahrens); 3(Ahrens); 4(Ahrens); 5(Ahrens); 1(Becker); 2(Becker); 3(Becker); 4(Becker); 5(Becker); 1(Ernst); 2(Ernst); 3(Ernst); 4(Ernst); 5(Ernst); 1(Müller); 2(Müller); 3(Müller); 4(Müller); 5(Müller) |
Prüfer | 4 | Ahrens; Becker; Ernst; Müller |
Weitere Informationen zu Faktoren finden Sie unter Faktoren und Faktorstufen, Was sind Faktoren, gekreuzte Faktoren und geschachtelte Faktoren? und Wodurch unterscheiden sich feste Faktoren und Zufallsfaktoren?.
Bei der nominalen logistischen Gleichung wird jedes nominale Ergebnis separat behandelt. Die Gleichung für die logistische Regression besteht aus mehreren Logit-Funktionen, eine für jeden Wert der Antwortvariablen minus eins. Jede Gleichung weist eine eindeutige Steigung für die Prädiktoren auf. Mit diesen Gleichungen wird ausgewertet, wie sich die Wahrscheinlichkeit eines nominalen Ergebnisses in Bezug auf ein anderes nominales Ergebnis ändert, wenn sich die Prädiktorvariablen ändern.
Verwenden Sie die Koeffizienten, um zu untersuchen, wie sich die Wahrscheinlichkeit eines Ergebnisses bei einer Änderung der Prädiktorvariablen ändert. Der geschätzte Koeffizient für einen Prädiktor stellt die Änderung in der Linkfunktion bei einer Änderung des Prädiktors um eine Einheit dar, wenn die anderen Prädiktoren im Modell auf konstanten Werten gehalten werden. Die Beziehung zwischen dem Koeffizienten und der Wahrscheinlichkeit eines Ergebnisses hängt von verschiedenen Aspekten der Analyse ab, darunter das Referenzergebnis für die Antwortvariable und die Referenzstufen für die kategorialen Prädiktoren. Positive Koeffizienten führen in der Regel dazu, dass die Wahrscheinlichkeit für das Referenzergebnis bei einem zunehmenden Prädiktor sinkt. Negative Koeffizienten führen dazu, dass die Wahrscheinlichkeit für das Referenzergebnis bei einem zunehmenden Prädiktor steigt. Ein geschätzter Koeffizient nahe 0 weist darauf hin, dass der Effekt des Prädiktors gering ist.
Die Leiterin einer Schule möchte beispielsweise unterschiedliche Lehrmethoden untersuchen. Sie verwendet Alter und Lehrmethode, um zu prognostizieren, welche Fächer die Schüler bevorzugen. Das erste Ergebnis befindet sich in der Tabelle mit den Informationen zu der Antwortvariablen an erster Stelle; es ist das Referenzergebnis für die Antwortvariable. Für diese Daten ist das Referenzergebnis, dass die Schüler Sachkunde bevorzugen. Mit Logit 1 wird die Wahrscheinlichkeit verglichen, dass ein Schüler Mathematik gegenüber Sachkunde bevorzugt. In dieser Gleichung ist der p-Wert des Koeffizienten für Alter größer als 0,7. Ein so hoher p-Wert deutet darauf hin, dass das Alter geringe Auswirkungen darauf hat, ob ein Schüler Mathematik gegenüber Sachkunde bevorzugt.
Mit Logit 2 werden Kunst und Sachkunde verglichen. In dieser Gleichung ist der Koeffizient für das Alter größer als der Koeffizient, mit dem Mathematik mit Sachkunde verglichen wird. Der Koeffizient für das Alter ist positiv. Mit zunehmendem Alter der Schüler steigt die Wahrscheinlichkeit, dass sie Kunst gegenüber Sachkunde bevorzugen.
Die Interpretation der Koeffizienten für kategoriale Prädiktoren hängt von der Referenzstufe des Faktors ab. In den Daten zu den Lehrmethoden gibt es die beiden Stufen „Vorführen“ und „Erklären“ für die Lehrmethode. „Vorführen“ ist nicht in der Koeffiziententabelle enthalten, daher ist „Vorführen“ die Referenzstufe. In der Gleichung, mit der Mathematik und Sachkunde verglichen werden, ist der p-Wert für „Erklären“ größer als 0,5. Ein so hoher p-Wert deutet darauf hin, dass die Lehrmethode geringe Auswirkungen darauf hat, ob ein Schüler Mathematik gegenüber Sachkunde bevorzugt.
Bei Logit 2 ist der Koeffizient für „Erklären“ größer als der Koeffizient, mit dem Mathematik mit Sachkunde verglichen wird. Der p-Wert für diesen Koeffizienten ist kleiner als 0,05, dieser Koeffizient ist also auf dem Niveau 0,05 statistisch signifikant. Der Koeffizient für „Erklären“ in dieser Gleichung ist positiv. Wenn die Lehrmethode „Erklären“ ist, bevorzugt ein Schüler mit größerer Wahrscheinlichkeit Kunst.
Variable | Wert | Anzahl | |
---|---|---|---|
Lehrfach | Sachkunde | 10 | (Referenzereignis) |
Mathematik | 11 | ||
Kunst | 9 | ||
Gesamt | 30 |
Faktor | Stufen | Werte |
---|---|---|
Lehrmethode | 2 | Vorführen; Erklären |
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis |
---|---|---|---|---|---|
Logit 1: (Mathematik/Sachkunde) | |||||
Konstante | -1,12266 | 4,56425 | -0,25 | 0,806 | |
Lehrmethode | |||||
Erklären | -0,563115 | 0,937591 | -0,60 | 0,548 | 0,57 |
Alter | 0,124674 | 0,401079 | 0,31 | 0,756 | 1,13 |
Logit 2: (Kunst/Sachkunde) | |||||
Konstante | -13,8485 | 7,24256 | -1,91 | 0,056 | |
Lehrmethode | |||||
Erklären | 2,76992 | 1,37209 | 2,02 | 0,044 | 15,96 |
Alter | 1,01354 | 0,584494 | 1,73 | 0,083 | 2,76 |
95%-KI | ||
---|---|---|
Prädiktor | Untergrenze | Obergrenze |
Logit 1: (Mathematik/Sachkunde) | ||
Konstante | ||
Lehrmethode | ||
Erklären | 0,09 | 3,58 |
Alter | 0,52 | 2,49 |
Logit 2: (Kunst/Sachkunde) | ||
Konstante | ||
Lehrmethode | ||
Erklären | 1,08 | 234,90 |
Alter | 0,88 | 8,66 |
DF | G | p-Wert |
---|---|---|
4 | 12,825 | 0,012 |
Methode | Chi-Quadrat | DF | p |
---|---|---|---|
Pearson | 6,95295 | 10 | 0,730 |
Abweichung | 7,88622 | 10 | 0,640 |
Der Standardfehler des Koeffizienten ist ein Schätzwert der Streuung zwischen den Koeffizientenschätzwerten, die Sie erhalten würden, wenn Sie wiederholt Stichproben aus derselben Grundgesamtheit entnehmen würden. Bei der Berechnung wird angenommen, dass der Stichprobenumfang und die zu schätzenden Koeffizienten gleich bleiben, wenn Sie wiederholt Stichproben ziehen.
Verwenden Sie den Standardfehler des Koeffizienten, um die Präzision des Schätzwerts für den Koeffizienten zu ermitteln. Je geringer der Standardfehler ist, desto präziser ist der Schätzwert.
Beim z-Wert handelt es sich um eine Teststatistik, mit der das Verhältnis zwischen dem Koeffizienten und dem zugehörigen Standardfehler gemessen wird.
Minitab verwendet den z-Wert zum Berechnen des p-Werts, anhand dessen Sie eine Entscheidung über die statistische Signifikanz der Terme und des Modells treffen können. Der Test ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Koeffizienten der Stichprobe einer Normalverteilung folgt.
Ein hinreichend weit von 0 entfernter z-Wert weist darauf hin, dass der Schätzwert des Koeffizienten sowohl groß als auch genau genug ist, um sich statistisch von 0 zu unterscheiden. Ein z-Wert, der nahe bei 0 liegt, weist hingegen darauf hin, dass der Schätzwert des Koeffizienten zu klein oder zu ungenau ist, um sicher sein zu können, dass der Term eine Auswirkung auf die Antwortvariable hat.
Der p-Wert ist ein Wahrscheinlichkeitsmaß für die Anzeichen gegen die Annahme der Nullhypothese. Geringere Wahrscheinlichkeiten liefern stärkere Anzeichen dafür, dass die Nullhypothese nicht zutrifft.
Mit dem Chancenverhältnis werden die Chancen von zwei Ergebnissen verglichen. Die Chancen eines Ergebnisses entsprechen der Wahrscheinlichkeit, dass das Vergleichsergebnis eintritt, geteilt durch die Wahrscheinlichkeit, dass das Referenzergebnis eintritt.
Verwenden Sie das Chancenverhältnis, um ein Verständnis des Effekts eines Prädiktors zu erlangen. Die Interpretation des Chancenverhältnisses hängt davon ab, ob es sich um einen kategorialen oder einen stetigen Prädiktor handelt. In der logistischen Regressionstabelle ist das Vergleichsergebnis das erste Ergebnis nach der „Logit“-Beschriftung, und das Referenzergebnis ist das zweite. Das Referenzergebnis ist für alle Logits gleich.
Chancenverhältnisse größer als 1 weisen darauf hin, dass das Vergleichsergebnis mit zunehmenden Prädiktorwerten kontinuierlich wahrscheinlicher als das Referenzergebnis wird. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Referenzergebnis wahrscheinlicher als das Vergleichsergebnis ist.
Die Leiterin einer Schule möchte beispielsweise unterschiedliche Lehrmethoden untersuchen. Für Logit 1 ist das Vergleichsergebnis Mathematik. Für Logit 2 ist das Vergleichsergebnis Kunst. Das Referenzergebnis ist Sachkunde. Bei Logit 2 beträgt der Schätzwert des Chancenverhältnisses 2,76, ist also größer als 1. Mit zunehmendem Alter steigt die Wahrscheinlichkeit, dass die Schüler Kunst gegenüber Sachkunde bevorzugen. Mit jedem weiteren Jahr ist die Chance, dass die Schüler Kunst bevorzugen, dreimal größer als die Chance, dass sie Sachkunde bevorzugen.
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis |
---|---|---|---|---|---|
Logit 1: (Mathematik/Sachkunde) | |||||
Konstante | -1,12266 | 4,56425 | -0,25 | 0,806 | |
Lehrmethode | |||||
Erklären | -0,563115 | 0,937591 | -0,60 | 0,548 | 0,57 |
Alter | 0,124674 | 0,401079 | 0,31 | 0,756 | 1,13 |
Logit 2: (Kunst/Sachkunde) | |||||
Konstante | -13,8485 | 7,24256 | -1,91 | 0,056 | |
Lehrmethode | |||||
Erklären | 2,76992 | 1,37209 | 2,02 | 0,044 | 15,96 |
Alter | 1,01354 | 0,584494 | 1,73 | 0,083 | 2,76 |
95%-KI | ||
---|---|---|
Prädiktor | Untergrenze | Obergrenze |
Logit 1: (Mathematik/Sachkunde) | ||
Konstante | ||
Lehrmethode | ||
Erklären | 0,09 | 3,58 |
Alter | 0,52 | 2,49 |
Logit 2: (Kunst/Sachkunde) | ||
Konstante | ||
Lehrmethode | ||
Erklären | 1,08 | 234,90 |
Alter | 0,88 | 8,66 |
Bei kategorialen Prädiktoren ist das Chancenverhältnis ein Vergleich der Chancen für das Vergleichsergebnis auf zwei verschiedenen Stufen des Prädiktors. Die Vergleichsstufe befindet sich in der logistischen Regressionstabelle und weist ein geschätztes Chancenverhältnis auf. Chancenverhältnisse größer als 1 weisen darauf hin, dass das Vergleichsergebnis gegenüber dem Referenzergebnis wahrscheinlicher wird, wenn sich der kategoriale Prädiktor von der Referenzstufe auf die Vergleichsstufe ändert. Chancenverhältnisse kleiner als 1 weisen darauf hin, dass das Vergleichsergebnis gegenüber dem Referenzergebnis weniger wahrscheinlich wird, wenn sich der kategoriale Prädiktor von der Referenzstufe auf die Vergleichsstufe ändert.
Die Leiterin einer Schule möchte beispielsweise unterschiedliche Lehrmethoden untersuchen. Für Logit 1 ist das Vergleichsergebnis Mathematik. Für Logit 2 ist das Vergleichsergebnis Kunst. Das Referenzergebnis ist Sachkunde. Bei Logit 2 beträgt der Schätzwert des Chancenverhältnisses für die Lehrmethode 15,96, ist also größer als 1. Wenn sich die Lehrmethode von „Vorführen“ auf „Erklären“ ändert, sind die Chancen, dass Schüler Kunst bevorzugen, ungefähr 16 Mal größer als die Chancen, dass sie Sachkunde bevorzugen.
Prädiktor | Koef | SE Koef | z | p | Chancenverhältnis |
---|---|---|---|---|---|
Logit 1: (Mathematik/Sachkunde) | |||||
Konstante | -1,12266 | 4,56425 | -0,25 | 0,806 | |
Lehrmethode | |||||
Erklären | -0,563115 | 0,937591 | -0,60 | 0,548 | 0,57 |
Alter | 0,124674 | 0,401079 | 0,31 | 0,756 | 1,13 |
Logit 2: (Kunst/Sachkunde) | |||||
Konstante | -13,8485 | 7,24256 | -1,91 | 0,056 | |
Lehrmethode | |||||
Erklären | 2,76992 | 1,37209 | 2,02 | 0,044 | 15,96 |
Alter | 1,01354 | 0,584494 | 1,73 | 0,083 | 2,76 |
95%-KI | ||
---|---|---|
Prädiktor | Untergrenze | Obergrenze |
Logit 1: (Mathematik/Sachkunde) | ||
Konstante | ||
Lehrmethode | ||
Erklären | 0,09 | 3,58 |
Alter | 0,52 | 2,49 |
Logit 2: (Kunst/Sachkunde) | ||
Konstante | ||
Lehrmethode | ||
Erklären | 1,08 | 234,90 |
Alter | 0,88 | 8,66 |
Diese Konfidenzintervalle (KI) sind Bereiche von Werten, die wahrscheinlich die tatsächlichen Werte der Chancenverhältnisse enthalten. Die Konfidenzintervalle werden auf der Grundlage der Normalverteilung berechnet. Das Konfidenzintervall ist genau, wenn der Stichprobenumfang ausreichend groß ist, so dass die Verteilung der Chancenverhältnisse der Stichprobe einer Normalverteilung folgt.
Da die Stichproben zufällig sind, ist es unwahrscheinlich, dass zwei Stichproben aus einer Grundgesamtheit identische Konfidenzintervalle ergeben. Wenn Sie jedoch viele Zufallsstichproben ziehen, enthält ein gewisser Prozentsatz der resultierenden Konfidenzintervalle den unbekannten Parameter der Grundgesamtheit. Der Prozentsatz dieser Konfidenzintervalle, die den Parameter enthalten, stellt das Konfidenzniveau des Intervalls dar.
Verwenden Sie das Konfidenzintervall, um den Schätzwert des Chancenverhältnisses zu beurteilen.
Bei einem 95%-Konfidenzniveau können Sie sich beispielsweise zu 95 % sicher sein, dass das Konfidenzintervall den Wert des Chancenverhältnisses für die Grundgesamtheit enthält. Anhand des Konfidenzintervalls können Sie die praktische Signifikanz Ihrer Ergebnisse beurteilen. Bestimmen Sie anhand Ihrer Fachkenntnisse, ob das Konfidenzintervall Werte umfasst, die in der jeweiligen Situation von praktischer Signifikanz sind. Wenn das Intervall zu breit und damit nicht hilfreich ist, erwägen Sie, den Stichprobenumfang zu vergrößern.
Bei diesem Test handelt es sich um einen Gesamttest, der alle Koeffizienten für einen kategorialen Prädiktor gleichzeitig berücksichtigt. Er ist für kategoriale Prädiktoren mit mehr als 2 Stufen vorgesehen.
Verwenden Sie diesen Test, um zu bestimmen, ob ein kategorialer Prädiktor mit mehr als einem Koeffizienten eine statistisch signifikante Beziehung zu den Ereignissen der Antwortvariablen aufweist. Wenn ein kategorialer Prädiktor mehr als zwei Stufen umfasst, weisen die Koeffizienten für die einzelnen Stufen unterschiedliche p-Werte auf. Der Gesamttest liefert genau eine Antwort auf die Frage, ob der Prädiktor statistisch signifikant ist.
Minitab maximiert die Log-Likelihood-Funktion, um optimale Werte für die geschätzten Koeffizienten zu berechnen.
Verwenden Sie die Log-Likelihood, um zwei Modelle zu vergleichen, bei denen zum Schätzen der Koeffizienten dieselben Daten genutzt werden. Da die Werte negativ sind, ist das Modell umso besser an die Daten angepasst, je näher der Wert an 0 liegt.
Die Log-Likelihood kann nicht abnehmen, wenn Sie einem Modell Terme hinzufügen. Ein Modell mit 5 Termen weist z. B. eine höhere Log-Likelihood als jedes Modell mit 4 Termen auf, das Sie anhand derselben Terme erstellen können. Die Log-Likelihood ist daher am nützlichsten, wenn Sie Modelle derselben Größe vergleichen. Um Entscheidungen über einzelne Terme zu treffen, verwenden Sie in der Regel die p-Werte für den Term in den verschiedenen Logits.
Bei diesem Test handelt es sich um einen Gesamttest, der alle Koeffizienten für die Prädiktoren im Modell berücksichtigt.
Verwenden Sie diesen Test, um zu bestimmen, ob mindestens ein Prädiktor im Modell eine statistisch signifikante Assoziation mit den Ereignissen der Antwortvariablen aufweist. In der Regel werden die G-Statistik und die Freiheitsgrade (DF) nicht interpretiert. Die DF entsprechen der Anzahl der Koeffizienten für die Prädiktoren im Modell.
Beim Pearson-Test auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.
Beim Abweichungstest auf Güte der Anpassung wird der Unterschied zwischen dem aktuellen Modell und dem vollständigen Modell ausgewertet.