Beispiel für Binäres logistisches Modell anpassen

Ein Marketingberater eines Frühstücksflockenherstellers untersucht die Effektivität eines Fernsehwerbespots für ein neues Frühstücksflockenprodukt. Der Berater lässt den Werbespot in einer bestimmten Gemeinde für eine Woche ausstrahlen. Anschließend wählt der Berater nach dem Zufallsprinzip erwachsene Personen beim Verlassen eines lokalen Supermarkts als Stichprobe aus, um sie zu befragen, ob sie den Werbespot gesehen und das neue Frühstücksflockenprodukt gekauft haben. Darüber hinaus befragt er sie, ob sie Kinder haben und wie hoch ihr jährliches Haushaltseinkommen ist.

Da es sich bei der Antwortvariablen um eine binäre Variable handelt, verwendet der Berater eine binäre logistische Regression, um festzustellen, ob der Umstand, dass der Spot gesehen wurde, das Vorhandensein von Kindern im Haushalt und das Haushaltseinkommen in einer Beziehung zur Kaufentscheidung der Erwachsenen stehen.

  1. Öffnen Sie die Beispieldaten FrühstücksflockenKauf.MTW.
  2. Wählen Sie Statistik > Regression > Binäre logistische Regression > Binäres logistisches Modell anpassen aus.
  3. Wählen Sie in der Dropdownliste die Option Antwort im binären Antwort-/Häufigkeitenformat aus.
  4. Geben Sie im Feld Antwort die Spalte Gekauft ein.
  5. Geben Sie im Feld Stetige Prädiktoren die Spalte Einkommen ein.
  6. Geben Sie im Feld Kategoriale Prädiktoren die Spalten KinderSpotGesehen ein.
  7. Klicken Sie auf Optionen. Geben Sie unter Konfidenzniveau für alle Intervalle den Wert 90 ein.
  8. Klicken Sie in den einzelnen Dialogfeldern auf OK.

Interpretieren der Ergebnisse

Die Tabelle der Varianzanalyse gibt an, welche Prädiktoren eine signifikante Beziehung mit der Antwortvariablen aufweisen. Der Berater verwendet ein Signifikanzniveau von 0,10, und die Ergebnisse zeigen, dass die Prädiktoren „Kinder“ und „SpotGesehen“ eine statistisch signifikante Beziehung zur Antwortvariablen aufweisen. „Einkommen“ weist keine statistisch signifikante Beziehung zur Antwortvariablen auf, da der p-Wert größer als 0,10 ist. Der Berater sollte das Modell möglicherweise ohne die Variable „Einkommen“ erneut anpassen.

Das Chancenverhältnis gibt an, dass bei Erwachsenen mit Kindern die Wahrscheinlichkeit, dass sie die Frühstücksflocken kaufen, rund 4,2 Mal größer als bei Erwachsenen ohne Kinder ist. Das Chancenverhältnis für Erwachsene, die den Spot gesehen haben, gibt an, dass die Wahrscheinlichkeit, dass sie die Frühstücksflocken kaufen, 2,8 Mal größer als bei Erwachsenen ist, die den Spot nicht gesehen haben.

Die Tests auf Güte der Anpassung sind alle größer als das Signifikanzniveau 0,05. Dies weist darauf hin, dass keine ausreichenden Anzeichen vorliegen, um schlussfolgern zu können, dass das Modell nicht an die Daten angepasst ist. Das R2 gibt an, dass das Modell rund 12,7 % der Abweichung in der Antwortvariablen erklärt.

Methode

LinkfunktionLogit
Kodierung der kategorialen Prädiktoren(1; 0)
Verwendete Zeilen71

Informationen zur Antwortvariablen

VariableWertAnzahl
Gekauft122(Ereignis)
  049 
  Gesamt71 

Regressionsgleichung

p(1)=exp(Y')/(1 + exp(Y'))
KinderSpotGesehen
NeinNeinY'=-3,016 + 0,01374 Einkommen
         
NeinJaY'=-1,982 + 0,01374 Einkommen
         
JaNeinY'=-1,583 + 0,01374 Einkommen
         
JaJaY'=-0,5490 + 0,01374 Einkommen

Koeffizienten

TermKoefSE Koefz-Wertp-WertVIF
Konstante-3,0160,939-3,210,001 
Einkommen0,01370,01950,710,4811,15
Kinder         
  Ja1,4330,8561,670,0941,12
SpotGesehen         
  Ja1,0340,5721,810,0701,03

Chancenverhältnisse für stetige Prädiktoren

Chancenverhältnis90%-KI
Einkommen1,0138(0,9819; 1,0469)

Chancenverhältnisse für kategoriale Prädiktoren

Stufe AStufe BChancenverhältnis90%-KI
Kinder     
  JaNein4,1902(1,0245; 17,1386)
SpotGesehen     
  JaNein2,8128(1,0982; 7,2044)
Chancenverhältnis für Stufe A relativ zu Stufe B

Zusammenfassung des Modells

R-Qd der
Abweichung
R-Qd(kor)
der
Abweichung
AICAICcBICFläche unter
der ROC-Kurve
12,66%9,25%84,7785,3793,820,7333

Tests auf Güte der Anpassung

TestDFChi-Quadratp-Wert
Abweichung6776,770,194
Pearson6776,110,209
Hosmer-Lemeshow85,580,694

Varianzanalyse



Wald-Test
QuelleDFChi-Quadratp-Wert
Regression38,790,032
  Einkommen10,500,481
  Kinder12,800,094
  SpotGesehen13,270,070

Anpassungen und Bewertung für ungewöhnliche Beobachtungen

BeobBeobachtete
Wahrscheinlichkeit
AnpassungResidStd. Resid
501,0000,0622,3572,40R
681,0000,0912,1892,28R
R  Großes Residuum