In der Kontingenztafel werden Beobachtungen nach mehreren kategorialen Variablen ausgezählt. Die Zeilen und Spalten der Tabelle entsprechen den kategorialen Variablen. Die Tafel enthält auch Randsummen für jede Stufe der Variablen.
Die Kontingenztafel für eine einfache Korrespondenzanalyse ist eine Zwei-Weg-Tabelle, in der Beobachtungen nach zwei kategorialen Variablen ausgezählt werden. Sie können Beobachtungen auch nach drei oder vier Variablen kategorisieren, indem Sie mit Hilfe des Unterdialogfelds Kombinieren die Variablen kreuzen und die Zeilen und/oder Spalten einer Zwei-Weg-Tabelle erstellen.
Verwenden Sie die Kontingenztafel, um die erwartete Häufigkeit für jede Zelle anzuzeigen, die durch eine Zeilenkategorie und eine Spaltenkategorie definiert ist. Verwenden Sie die Spalten- und Zeilensummen, um die Gesamthäufigkeit für jede Kategorie zu erfahren.
A | B | C | D | E | Gesamt | |
---|---|---|---|---|---|---|
Geologie | 3,000 | 19,000 | 39,000 | 14,000 | 10,000 | 85,000 |
Biochemie | 1,000 | 2,000 | 13,000 | 1,000 | 12,000 | 29,000 |
Chemie | 6,000 | 25,000 | 49,000 | 21,000 | 29,000 | 130,000 |
Zoologie | 3,000 | 15,000 | 41,000 | 35,000 | 26,000 | 120,000 |
Physik | 10,000 | 22,000 | 47,000 | 9,000 | 26,000 | 114,000 |
Technik | 3,000 | 11,000 | 25,000 | 15,000 | 34,000 | 88,000 |
Mikrobiologie | 1,000 | 6,000 | 14,000 | 5,000 | 11,000 | 37,000 |
Botanik | 0,000 | 12,000 | 34,000 | 17,000 | 23,000 | 86,000 |
Statistik | 2,000 | 5,000 | 11,000 | 4,000 | 7,000 | 29,000 |
Mathematik | 2,000 | 11,000 | 37,000 | 8,000 | 20,000 | 78,000 |
Gesamt | 31,000 | 128,000 | 310,000 | 129,000 | 198,000 | 796,000 |
In der folgenden Zwei-Weg-Kontingenztafel werden die beobachteten Häufigkeiten der Forscher in den einzelnen akademischen Fachgebieten und Finanzierungskategorien (A, B, C, D, E) angezeigt. Die Summenspalte zeigt, dass die meisten Forscher auf den Gebieten Chemie (130), Zoologie (120) und Physik (114) vorhanden sind. Die Summenzeile gibt an, dass die meisten Forscher in Finanzierungskategorie C klassifiziert wurden (310). Bei den Häufigkeiten in den Zellen weisen Chemiker, die in Finanzierungskategorie C klassifiziert wurden, die größte beobachtete Häufigkeit auf (49).
Die erwartete Häufigkeit ist die in einer Zelle durchschnittlich zu erwartende Anzahl von Beobachtungen, wenn die Variablen unabhängig sind. Minitab berechnet die erwarteten Anzahlen als das Produkt aus den Zeilen- und Spaltensummen geteilt durch die Gesamtzahl der Beobachtungen.
A | B | C | D | E | |
---|---|---|---|---|---|
Geologie | 3,310 | 13,668 | 33,103 | 13,775 | 21,143 |
Biochemie | 1,129 | 4,663 | 11,294 | 4,700 | 7,214 |
Chemie | 5,063 | 20,905 | 50,628 | 21,068 | 32,337 |
Zoologie | 4,673 | 19,296 | 46,734 | 19,447 | 29,849 |
Physik | 4,440 | 18,332 | 44,397 | 18,475 | 28,357 |
Technik | 3,427 | 14,151 | 34,271 | 14,261 | 21,889 |
Mikrobiologie | 1,441 | 5,950 | 14,410 | 5,996 | 9,204 |
Botanik | 3,349 | 13,829 | 33,492 | 13,937 | 21,392 |
Statistik | 1,129 | 4,663 | 11,294 | 4,700 | 7,214 |
Mathematik | 3,038 | 12,543 | 30,377 | 12,641 | 19,402 |
In der folgenden Tabelle der erwarteten Häufigkeiten werden die erwarteten Anzahlen der Forscher in den einzelnen akademischen Fachgebieten und Finanzierungskategorien (A, B, C, D, E) angezeigt; dabei wird davon ausgegangen, dass Finanzierung und akademisches Fachgebiet unabhängig voneinander sind. Da die meisten Forscher in der Chemie tätig sind und sich die meisten Fachgebiete in der Finanzierungskategorie C befinden, weist die Kombination dieser Kategorien den höchsten Wert auf (ca. 51).
Beobachtete – erwartete Häufigkeiten ist die Differenz zwischen der tatsächlichen Anzahl der Beobachtungen in der Zelle und der Anzahl der Beobachtungen in der Zelle, die Sie erwarten würden, wenn die Variablen unabhängig wären.
Verwenden Sie die Differenz zwischen den beobachteten und den erwarteten Werten, um nach Anzeichen für mögliche Assoziationen in den Daten zu suchen. Wenn eine Assoziation zwischen zwei Variablen besteht, variiert die Verteilung der Beobachtungen für eine Variable abhängig von der Kategorie der zweiten Variablen. Im Ergebnis ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Häufigkeit relativ groß. Wenn keine Assoziation zwischen den beiden Variablen besteht, ähneln sich die Verteilungen der Beobachtungen für eine Variable bei allen Kategorien der zweiten Variablen. Im Ergebnis ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Häufigkeit relativ klein.
A | B | C | D | E | |
---|---|---|---|---|---|
Geologie | -0,310 | 5,332 | 5,897 | 0,225 | -11,143 |
Biochemie | -0,129 | -2,663 | 1,706 | -3,700 | 4,786 |
Chemie | 0,937 | 4,095 | -1,628 | -0,068 | -3,337 |
Zoologie | -1,673 | -4,296 | -5,734 | 15,553 | -3,849 |
Physik | 5,560 | 3,668 | 2,603 | -9,475 | -2,357 |
Technik | -0,427 | -3,151 | -9,271 | 0,739 | 12,111 |
Mikrobiologie | -0,441 | 0,050 | -0,410 | -0,996 | 1,796 |
Botanik | -3,349 | -1,829 | 0,508 | 3,063 | 1,608 |
Statistik | 0,871 | 0,337 | -0,294 | -0,700 | -0,214 |
Mathematik | -1,038 | -1,543 | 6,623 | -4,641 | 0,598 |
In dieser Tabelle ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Anzahl für Zoologie und Finanzierungskategorie D (15,553) sowie für Technik und Finanzierungskategorie E (12,111) relativ groß. Bei diesen Zellen sind die beobachteten Anzahlen größer als die Anzahl, die Sie erwarten würden, wenn die Variablen unabhängig wären. Der Betrag der Differenz ist auch für Geologie und Finanzierungskategorie E relativ groß (-11,143). Bei dieser Zelle ist die beobachtete Anzahl kleiner als die Anzahl, die Sie bei unabhängigen Variablen erwarten würden. Sie können daher schlussfolgern, dass deutlich mehr Abteilungen der Ingenieurswissenschaften und deutlich weniger Geologieabteilungen unfinanziert waren als erwartet.
Minitab zeigt den Beitrag jeder Zelle zur Chi-Quadrat-Statistik als Chi-Quadrat-Distanz an. Die Chi-Quadrat-Distanz für jede Zelle gibt an, welcher Anteil an der Chi-Quadrat-Gesamtstatistik auf die Abweichung der jeweiligen Zelle zurückzuführen ist.
Minitab berechnet den Beitrag jeder Zelle zur Chi-Quadrat-Statistik als Quadrat der Differenz zwischen dem beobachteten und dem erwarteten Wert für eine Zelle dividiert durch den erwarteten Wert für die betreffende Zelle. Die Chi-Quadrat-Gesamtstatistik stellt die Summe aus diesen Werten für alle Zellen dar.
Sie können die Chi-Quadrat-Distanzen für die einzelnen Zellen vergleichen, um zu untersuchen, welche Zellen am meisten zum Chi-Quadrat-Gesamtwert beitragen. Wenn die beobachtete und die erwartete Zellenhäufigkeit stark voneinander abweichen, ist der Chi-Quadrat-Wert für die Zelle größer. Eine größere Chi-Quadrat-Distanz in einer Zelle weist daher auf eine stärkere Assoziation zwischen den Zeilen- und Spaltenkategorien hin, als zufällig zu erwarten wäre.
A | B | C | D | E | Gesamt | |
---|---|---|---|---|---|---|
Geologie | 0,029 | 2,080 | 1,050 | 0,004 | 5,873 | 9,036 |
Biochemie | 0,015 | 1,521 | 0,258 | 2,913 | 3,176 | 7,882 |
Chemie | 0,173 | 0,802 | 0,052 | 0,000 | 0,344 | 1,373 |
Zoologie | 0,599 | 0,957 | 0,703 | 12,438 | 0,496 | 15,194 |
Physik | 6,964 | 0,734 | 0,153 | 4,859 | 0,196 | 12,906 |
Technik | 0,053 | 0,702 | 2,508 | 0,038 | 6,700 | 10,001 |
Mikrobiologie | 0,135 | 0,000 | 0,012 | 0,166 | 0,351 | 0,663 |
Botanik | 3,349 | 0,242 | 0,008 | 0,673 | 0,121 | 4,393 |
Statistik | 0,671 | 0,024 | 0,008 | 0,104 | 0,006 | 0,814 |
Mathematik | 0,354 | 0,190 | 1,444 | 1,704 | 0,018 | 3,710 |
Gesamt | 12,343 | 7,252 | 6,196 | 22,899 | 17,282 | 65,972 |
In dieser Tabelle beträgt der Wert für Zoologie und Finanzierungskategorie D 12,438; damit wird der größte Beitrag zum Chi-Quadrat-Gesamtwert erklärt (65,972). Von den Zeilenkategorien tragen Zoologie (15,194), Physik (12,906) und Technik (10,001) am meisten zum Chi-Quadrat-Gesamtwert bei. Von den Spaltenkategorien tragen die Finanzierungsstufen D (22,899) und E (17,282) am meisten zum Chi-Quadrat-Gesamtwert bei.
Die Zellenträgheit ist der Chi-Quadrat-Wert in der Zelle dividiert durch die Gesamthäufigkeit für die Kontingenztafel. Die Gesamtträgheit bzw. Trägheit entspricht der Summe aller Zellenträgheiten. Die relative Trägheit für eine Zelle entspricht der Zellenträgheit dividiert durch die Gesamtträgheit. Die relative Trägheit für eine Zeile ist die Summe aller Zellenträgheiten in der Zeile dividiert durch die Gesamtträgheit. Die relative Trägheit für eine Spalte ist die Summe aller Zellenträgheiten in der Spalte dividiert durch die Gesamtträgheit.
Verwenden Sie die relative Trägheit, um die Stärke der Assoziationen zwischen Kategorien sowie die Beiträge zur Streuung in den Daten zu untersuchen. Höhere Werte weisen in der Regel auf eine stärkere Assoziation und einen größeren Anteil an der Gesamtstreuung in den Daten hin.
A | B | C | D | E | Gesamt | |
---|---|---|---|---|---|---|
Geologie | 0,000 | 0,032 | 0,016 | 0,000 | 0,089 | 0,137 |
Biochemie | 0,000 | 0,023 | 0,004 | 0,044 | 0,048 | 0,119 |
Chemie | 0,003 | 0,012 | 0,001 | 0,000 | 0,005 | 0,021 |
Zoologie | 0,009 | 0,015 | 0,011 | 0,189 | 0,008 | 0,230 |
Physik | 0,106 | 0,011 | 0,002 | 0,074 | 0,003 | 0,196 |
Technik | 0,001 | 0,011 | 0,038 | 0,001 | 0,102 | 0,152 |
Mikrobiologie | 0,002 | 0,000 | 0,000 | 0,003 | 0,005 | 0,010 |
Botanik | 0,051 | 0,004 | 0,000 | 0,010 | 0,002 | 0,067 |
Statistik | 0,010 | 0,000 | 0,000 | 0,002 | 0,000 | 0,012 |
Mathematik | 0,005 | 0,003 | 0,022 | 0,026 | 0,000 | 0,056 |
Gesamt | 0,187 | 0,110 | 0,094 | 0,347 | 0,262 | 1,000 |
In der Tabelle „Relative Trägheiten“ wird der relative Beitrag jeder Zelle zur Chi-Quadrat-Gesamtstatistik angezeigt. Je größer die relative Trägheit in einer Zelle, desto stärker ist die Assoziation zwischen den Zeilen- und Spaltenkategorien. In dieser Tabelle weist die Zelle für Zoologie und Finanzierungskategorie D die größte relative Trägheit (0,189) und damit die stärkste Assoziation auf. Die Tabelle gibt auch die relative Gesamtträgheit für jede Zeile und Spalte an.