Bei der binären logistischen Regression können Sie Daten in zwei verschiedenen Formaten eingeben: im binären Antwort-/Häufigkeitenformat und im Ereignis-/Versuchsformat. Das Format der Daten für die Analyse sollte in der Regel mit der Art und Weise der Datenerfassung übereinstimmen.
Sie erfassen und analysieren Daten in der Regel im Ereignis-/Versuchsformat, weil Sie damit viele Versuche gleichzeitig erfassen können. Beispiel: Ein Techniker stellt eine Charge von 200 integrierten Schaltkreisen her. Für alle Schaltkreise in der Charge müssen dieselben Prozesseinstellungen verwendet werden. Diese 200 Schaltkreise sind 200 Versuche. Wenn der Techniker Daten zu einer anderen Charge mit denselben Einstellungen erfasst, befinden sich die Daten in einer separaten Zeile.
Beim Ereignis-/Versuchsformat werden zwei Spalten für die Antwortvariable verwendet. Eine Spalte enthält die Anzahl der Erfolge bzw. Ereignisse von Interesse. Die andere Spalte enthält die Anzahl der Versuche.
C1 | C2 | C3 | C4 |
---|---|---|---|
Erfolge | Versuche | Temperatur | Rohmaterial |
180 | 200 | 1500 | Lieferant B |
200 | 200 | 1400 | Lieferant A |
196 | 200 | 1500 | Lieferant A |
197 | 200 | 1400 | Lieferant B |
190 | 200 | 1400 | Lieferant A |
193 | 200 | 1400 | Lieferant B |
198 | 200 | 1500 | Lieferant A |
185 | 200 | 1500 | Lieferant B |
Wenn die Daten im Arbeitsblatt das Ereignis-/Versuchsformat aufweisen, die Anzahl der Versuche pro Zeile aber gering ist, ändern sich Zuverlässigkeit und Interpretation der Statistiken. Beispiel: Wenn jede Zeile 1 Versuch enthält, beträgt die Anzahl der Ereignisse pro Zeile entweder 0 oder 1. Die Analyse dieser Daten ist die gleiche wie bei Daten im binären Antwort-/Häufigkeitenformat ohne Häufigkeitenspalte.
Sie erfassen und analysieren Daten in der Regel im binären Antwort-/Häufigkeitenformat, weil Sie damit das Ergebnis jedes einzelnen Versuchs unmittelbar erfassen können. Beispiel: Ein Marketingberater befragt Verbraucher direkt bei Verlassen des Supermarkts, ob sie eine neue Frühstücksflockenmarke gekauft haben. Der Berater zeichnet die individuellen Informationen jedes Verbrauchers auf, sobald dieser antwortet.
Beim binären Antwort-/Häufigkeitenformat wird eine Spalte für die Antwortvariable verwendet. Die Spalte der Antwortvariablen enthält zwei Werte, von denen einer für das Ereignis und einer für das Nicht-Ereignis steht.
C1 | C2 | C3 |
---|---|---|
Gekauft | Einkommen | Kinder |
Ja | 37 | Ja |
Nein | 47 | Ja |
Ja | 34 | Nein |
Ja | 58 | Nein |
Bei Daten im binären Antwort-/Häufigkeitenformat können Sie eine Häufigkeitenspalte einbinden. Für eine möglichst eindeutige Interpretation des Diagramms der Residuen im Vergleich zur Reihenfolge kombinieren Sie nur aufeinander folgende Beobachtungen. Die Kombination nicht aufeinander folgender Beobachtungen kann zu Mustern im Diagramm der Residuen im Vergleich zur Reihenfolge führen oder diese maskieren.
C1 | C2 | C3 | C4 |
---|---|---|---|
Gekauft | Einkommen | Kinder | Häufigkeit |
Ja | 40 | Ja | 2 |
Nein | 40 | Nein | 12 |
Ja | 45 | Ja | 1 |
Nein | 45 | Nein | 6 |