Eine Kontingenztafel ist eine Tabelle, in der Beobachtungen nach mehreren kategorialen Variablen ausgezählt werden. Die Zeilen und Spalten der Tabelle entsprechen diesen kategorialen Variablen.
Angenommen, bei einer kürzlich abgehaltenen Wahl mit zwei Kandidaten wurden 100 zufällig ausgewählte Wähler beim Verlassen des Wahllokals nach ihrer Wahl befragt, und die Ergebnisse wurden nach Geschlecht in einer Tabelle wie folgt aufgezeichnet:
Kandidat A | Kandidat B | Alle | |
---|---|---|---|
Männlich | 28 | 20 | 48 |
Weiblich | 39 | 13 | 52 |
Alle | 67 | 33 | 100 |
In dieser Kontingenztafel werden die Antworten nach Geschlecht und Stimmabgabe ausgezählt. Die Zählung an der Schnittstelle von Zeile i und Spalte j wird mit nij bezeichnet; sie stellt die Anzahl der Beobachtungen dar, die diese Kombination von Stufen aufweisen. Zum Beispiel zeigt n1,2 die Anzahl der männlichen Befragten an, die für Kandidat B gestimmt haben.
Die Tafel enthält auch Randsummen für jede Stufe der Variablen. Die Randsummen für die Zeilen zeigen, dass 52 der Befragten Frauen waren. Die Randsummen für die Spalten zeigen, dass 67 der Befragten für Kandidat A gestimmt haben. Außerdem zeigt die Gesamtsumme, dass der Stichprobenumfang 100 beträgt.
Kontingenztafeln können auch Assoziationen zwischen den beiden Variablen aufzeigen. Mit einem Chi-Quadrat-Test oder mit Fishers exaktem Test können Sie ermitteln, ob die beobachteten Anzahlen signifikant von den unter der Nullhypothese (keine Assoziation) erwarteten Anzahlen abweichen. Zum Beispiel können Sie testen, ob zwischen Geschlecht und Stimmabgabe eine Assoziation besteht.
Die einfachsten Kontingenztafeln sind Zwei-Weg-Tabellen, in denen die Antwortvariablen nach zwei Variablen ausgezählt werden. Sie können die Beobachtungen nach drei oder mehr Variablen kategorisieren, indem Sie sie „kreuzen“. Im obigen Wahlbeispiel können Sie die Antwortvariablen wie folgt nach Beschäftigungsstatus weiter klassifizieren:
Kandidat A | Kandidat B | Gesamt | |
---|---|---|---|
Männlich/in Beschäftigung | 18 | 19 | 37 |
Männlich/arbeitslos | 10 | 1 | 11 |
Weiblich/in Beschäftigung | 33 | 10 | 43 |
Weiblich/arbeitslos | 6 | 3 | 9 |
Gesamt | 67 | 33 | 100 |
Mit einer einfachen Korrespondenzanalyse können Sie Assoziationen in Kontingenztafeln ermitteln, in denen die Daten nach mehr als zwei Variablen kategorisiert sind. Um eine einfache Korrespondenzanalyse in Minitab durchzuführen, wählen Sie
aus.Mit können Sie das Chancenverhältnis und Konfidenzintervall berechnen.
Herzinfarkt | Kein Herzinfarkt | |
---|---|---|
Placebo | 189 | 10845 |
Aspirin | 104 | 10933 |
C1 | C2 | C3 |
---|---|---|
Gruppe | Herzinfarkt | Anzahl |
Placebo | Ja | 189 |
Placebo | Nein | 10845 |
Aspirin | Ja | 104 |
Aspirin | Nein | 10933 |
Das Chancenverhältnis beträgt 1,8321. Das bedeutet, dass für eine Person, die das Placebo einnimmt, die Wahrscheinlichkeit eines Herzinfarkts 1,8321 Mal größer ist als für eine Person, die Aspirin einnimmt. Sie können sich zu 95 % sicher sein, dass der tatsächliche Wert für das Chancenverhältnis zwischen 1,44 und 2,3308 liegt.
Die Daten in diesem Beispiel stammen von Seite 20 von A. Agresti (1996). An Introduction to Categorical Data Analysis, John Wiley & Sons, Inc. John Wiley & Sons, Inc. John Wiley & Sons, Inc.