Ein Marketingberater eines Frühstücksflockenherstellers untersucht die Effektivität eines Fernsehwerbespots für ein neues Frühstücksflockenprodukt. Der Berater lässt den Werbespot in einer bestimmten Gemeinde für eine Woche ausstrahlen. Anschließend wählt der Berater nach dem Zufallsprinzip erwachsene Personen beim Verlassen eines lokalen Supermarkts als Stichprobe aus, um sie zu befragen, ob sie den Werbespot gesehen und das neue Frühstücksflockenprodukt gekauft haben. Darüber hinaus befragt er sie, ob sie Kinder haben und wie hoch ihr jährliches Haushaltseinkommen ist.
Da es sich bei der Antwortvariablen um eine binäre Variable handelt, verwendet der Berater eine binäre logistische Regression, um festzustellen, ob der Umstand, dass der Spot gesehen wurde, das Vorhandensein von Kindern im Haushalt und das Haushaltseinkommen in einer Beziehung zur Kaufentscheidung der Erwachsenen stehen.
Die Tabelle der Varianzanalyse gibt an, welche Prädiktoren eine signifikante Beziehung mit der Antwortvariablen aufweisen. Der Berater verwendet ein Signifikanzniveau von 0,10, und die Ergebnisse zeigen, dass die Prädiktoren „Kinder“ und „SpotGesehen“ eine statistisch signifikante Beziehung zur Antwortvariablen aufweisen. „Einkommen“ weist keine statistisch signifikante Beziehung zur Antwortvariablen auf, da der p-Wert größer als 0,10 ist. Der Berater sollte das Modell möglicherweise ohne die Variable „Einkommen“ erneut anpassen.
Das Chancenverhältnis gibt an, dass bei Erwachsenen mit Kindern die Wahrscheinlichkeit, dass sie die Frühstücksflocken kaufen, rund 4,2 Mal größer als bei Erwachsenen ohne Kinder ist. Das Chancenverhältnis für Erwachsene, die den Spot gesehen haben, gibt an, dass die Wahrscheinlichkeit, dass sie die Frühstücksflocken kaufen, 2,8 Mal größer als bei Erwachsenen ist, die den Spot nicht gesehen haben.
Die Tests auf Güte der Anpassung sind alle größer als das Signifikanzniveau 0,05. Dies weist darauf hin, dass keine ausreichenden Anzeichen vorliegen, um schlussfolgern zu können, dass das Modell nicht an die Daten angepasst ist. Das R2 gibt an, dass das Modell rund 12,7 % der Abweichung in der Antwortvariablen erklärt.
Variable | Wert | Anzahl | |
---|---|---|---|
Gekauft | 1 | 22 | (Ereignis) |
0 | 49 | ||
Gesamt | 71 |
p(1) | = | exp(Y')/(1 + exp(Y')) |
---|
Kinder | SpotGesehen | |||
---|---|---|---|---|
Nein | Nein | Y' | = | -3,016 + 0,01374 Einkommen |
Nein | Ja | Y' | = | -1,982 + 0,01374 Einkommen |
Ja | Nein | Y' | = | -1,583 + 0,01374 Einkommen |
Ja | Ja | Y' | = | -0,5490 + 0,01374 Einkommen |
Term | Koef | SE Koef | z-Wert | p-Wert | VIF |
---|---|---|---|---|---|
Konstante | -3,016 | 0,939 | -3,21 | 0,001 | |
Einkommen | 0,0137 | 0,0195 | 0,71 | 0,481 | 1,15 |
Kinder | |||||
Ja | 1,433 | 0,856 | 1,67 | 0,094 | 1,12 |
SpotGesehen | |||||
Ja | 1,034 | 0,572 | 1,81 | 0,070 | 1,03 |
Chancenverhältnis | 90%-KI | |
---|---|---|
Einkommen | 1,0138 | (0,9819; 1,0469) |
Stufe A | Stufe B | Chancenverhältnis | 90%-KI |
---|---|---|---|
Kinder | |||
Ja | Nein | 4,1902 | (1,0245; 17,1386) |
SpotGesehen | |||
Ja | Nein | 2,8128 | (1,0982; 7,2044) |
R-Qd der Abweichung | R-Qd(kor) der Abweichung | AIC | AICc | BIC | Fläche unter der ROC-Kurve |
---|---|---|---|---|---|
12,66% | 9,25% | 84,77 | 85,37 | 93,82 | 0,7333 |
Test | DF | Chi-Quadrat | p-Wert |
---|---|---|---|
Abweichung | 67 | 76,77 | 0,194 |
Pearson | 67 | 76,11 | 0,209 |
Hosmer-Lemeshow | 8 | 5,58 | 0,694 |
Wald-Test | |||
---|---|---|---|
Quelle | DF | Chi-Quadrat | p-Wert |
Regression | 3 | 8,79 | 0,032 |
Einkommen | 1 | 0,50 | 0,481 |
Kinder | 1 | 2,80 | 0,094 |
SpotGesehen | 1 | 3,27 | 0,070 |
Beob | Beobachtete Wahrscheinlichkeit | Anpassung | Resid | Std. Resid | |
---|---|---|---|---|---|
50 | 1,000 | 0,062 | 2,357 | 2,40 | R |
68 | 1,000 | 0,091 | 2,189 | 2,28 | R |