Häufigkeiten und Chi-Quadrat-Distanzen für Einfache Korrespondenzanalyse

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken, die für Häufigkeiten und Chi-Quadrat-Distanzen in der einfachen Korrespondenzanalyse bereitgestellt werden.

Kontingenztafel

In der Kontingenztafel werden Beobachtungen nach mehreren kategorialen Variablen ausgezählt. Die Zeilen und Spalten der Tabelle entsprechen den kategorialen Variablen. Die Tafel enthält auch Randsummen für jede Stufe der Variablen.

Die Kontingenztafel für eine einfache Korrespondenzanalyse ist eine Zwei-Weg-Tabelle, in der Beobachtungen nach zwei kategorialen Variablen ausgezählt werden. Sie können Beobachtungen auch nach drei oder vier Variablen kategorisieren, indem Sie mit Hilfe des Unterdialogfelds Kombinieren die Variablen kreuzen und die Zeilen und/oder Spalten einer Zwei-Weg-Tabelle erstellen.

Interpretation

Verwenden Sie die Kontingenztafel, um die erwartete Häufigkeit für jede Zelle anzuzeigen, die durch eine Zeilenkategorie und eine Spaltenkategorie definiert ist. Verwenden Sie die Spalten- und Zeilensummen, um die Gesamthäufigkeit für jede Kategorie zu erfahren.

Kontingenztafel

ABCDEGesamt
Geologie3,00019,00039,00014,00010,00085,000
Biochemie1,0002,00013,0001,00012,00029,000
Chemie6,00025,00049,00021,00029,000130,000
Zoologie3,00015,00041,00035,00026,000120,000
Physik10,00022,00047,0009,00026,000114,000
Technik3,00011,00025,00015,00034,00088,000
Mikrobiologie1,0006,00014,0005,00011,00037,000
Botanik0,00012,00034,00017,00023,00086,000
Statistik2,0005,00011,0004,0007,00029,000
Mathematik2,00011,00037,0008,00020,00078,000
Gesamt31,000128,000310,000129,000198,000796,000

In der folgenden Zwei-Weg-Kontingenztafel werden die beobachteten Häufigkeiten der Forscher in den einzelnen akademischen Fachgebieten und Finanzierungskategorien (A, B, C, D, E) angezeigt. Die Summenspalte zeigt, dass die meisten Forscher auf den Gebieten Chemie (130), Zoologie (120) und Physik (114) vorhanden sind. Die Summenzeile gibt an, dass die meisten Forscher in Finanzierungskategorie C klassifiziert wurden (310). Bei den Häufigkeiten in den Zellen weisen Chemiker, die in Finanzierungskategorie C klassifiziert wurden, die größte beobachtete Häufigkeit auf (49).

Erwartete Häufigkeiten

Die erwartete Häufigkeit ist die in einer Zelle durchschnittlich zu erwartende Anzahl von Beobachtungen, wenn die Variablen unabhängig sind. Minitab berechnet die erwarteten Anzahlen als das Produkt aus den Zeilen- und Spaltensummen geteilt durch die Gesamtzahl der Beobachtungen.

Erwartete Häufigkeiten

ABCDE
Geologie3,31013,66833,10313,77521,143
Biochemie1,1294,66311,2944,7007,214
Chemie5,06320,90550,62821,06832,337
Zoologie4,67319,29646,73419,44729,849
Physik4,44018,33244,39718,47528,357
Technik3,42714,15134,27114,26121,889
Mikrobiologie1,4415,95014,4105,9969,204
Botanik3,34913,82933,49213,93721,392
Statistik1,1294,66311,2944,7007,214
Mathematik3,03812,54330,37712,64119,402

In der folgenden Tabelle der erwarteten Häufigkeiten werden die erwarteten Anzahlen der Forscher in den einzelnen akademischen Fachgebieten und Finanzierungskategorien (A, B, C, D, E) angezeigt; dabei wird davon ausgegangen, dass Finanzierung und akademisches Fachgebiet unabhängig voneinander sind. Da die meisten Forscher in der Chemie tätig sind und sich die meisten Fachgebiete in der Finanzierungskategorie C befinden, weist die Kombination dieser Kategorien den höchsten Wert auf (ca. 51).

Beobachtete – erwartete Häufigkeiten

Beobachtete – erwartete Häufigkeiten ist die Differenz zwischen der tatsächlichen Anzahl der Beobachtungen in der Zelle und der Anzahl der Beobachtungen in der Zelle, die Sie erwarten würden, wenn die Variablen unabhängig wären.

Interpretation

Verwenden Sie die Differenz zwischen den beobachteten und den erwarteten Werten, um nach Anzeichen für mögliche Assoziationen in den Daten zu suchen. Wenn eine Assoziation zwischen zwei Variablen besteht, variiert die Verteilung der Beobachtungen für eine Variable abhängig von der Kategorie der zweiten Variablen. Im Ergebnis ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Häufigkeit relativ groß. Wenn keine Assoziation zwischen den beiden Variablen besteht, ähneln sich die Verteilungen der Beobachtungen für eine Variable bei allen Kategorien der zweiten Variablen. Im Ergebnis ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Häufigkeit relativ klein.

Beobachtete - erwartete Häufigkeiten

ABCDE
Geologie-0,3105,3325,8970,225-11,143
Biochemie-0,129-2,6631,706-3,7004,786
Chemie0,9374,095-1,628-0,068-3,337
Zoologie-1,673-4,296-5,73415,553-3,849
Physik5,5603,6682,603-9,475-2,357
Technik-0,427-3,151-9,2710,73912,111
Mikrobiologie-0,4410,050-0,410-0,9961,796
Botanik-3,349-1,8290,5083,0631,608
Statistik0,8710,337-0,294-0,700-0,214
Mathematik-1,038-1,5436,623-4,6410,598

In dieser Tabelle ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Anzahl für Zoologie und Finanzierungskategorie D (15,553) sowie für Technik und Finanzierungskategorie E (12,111) relativ groß. Bei diesen Zellen sind die beobachteten Anzahlen größer als die Anzahl, die Sie erwarten würden, wenn die Variablen unabhängig wären. Der Betrag der Differenz ist auch für Geologie und Finanzierungskategorie E relativ groß (-11,143). Bei dieser Zelle ist die beobachtete Anzahl kleiner als die Anzahl, die Sie bei unabhängigen Variablen erwarten würden. Sie können daher schlussfolgern, dass deutlich mehr Abteilungen der Ingenieurswissenschaften und deutlich weniger Geologieabteilungen unfinanziert waren als erwartet.

Chi-Quadrat-Distanzen

Minitab zeigt den Beitrag jeder Zelle zur Chi-Quadrat-Statistik als Chi-Quadrat-Distanz an. Die Chi-Quadrat-Distanz für jede Zelle gibt an, welcher Anteil an der Chi-Quadrat-Gesamtstatistik auf die Abweichung der jeweiligen Zelle zurückzuführen ist.

Minitab berechnet den Beitrag jeder Zelle zur Chi-Quadrat-Statistik als Quadrat der Differenz zwischen dem beobachteten und dem erwarteten Wert für eine Zelle dividiert durch den erwarteten Wert für die betreffende Zelle. Die Chi-Quadrat-Gesamtstatistik stellt die Summe aus diesen Werten für alle Zellen dar.

Interpretation

Sie können die Chi-Quadrat-Distanzen für die einzelnen Zellen vergleichen, um zu untersuchen, welche Zellen am meisten zum Chi-Quadrat-Gesamtwert beitragen. Wenn die beobachtete und die erwartete Zellenhäufigkeit stark voneinander abweichen, ist der Chi-Quadrat-Wert für die Zelle größer. Eine größere Chi-Quadrat-Distanz in einer Zelle weist daher auf eine stärkere Assoziation zwischen den Zeilen- und Spaltenkategorien hin, als zufällig zu erwarten wäre.

Chi-Quadrat-Distanzen

ABCDEGesamt
Geologie0,0292,0801,0500,0045,8739,036
Biochemie0,0151,5210,2582,9133,1767,882
Chemie0,1730,8020,0520,0000,3441,373
Zoologie0,5990,9570,70312,4380,49615,194
Physik6,9640,7340,1534,8590,19612,906
Technik0,0530,7022,5080,0386,70010,001
Mikrobiologie0,1350,0000,0120,1660,3510,663
Botanik3,3490,2420,0080,6730,1214,393
Statistik0,6710,0240,0080,1040,0060,814
Mathematik0,3540,1901,4441,7040,0183,710
Gesamt12,3437,2526,19622,89917,28265,972

In dieser Tabelle beträgt der Wert für Zoologie und Finanzierungskategorie D 12,438; damit wird der größte Beitrag zum Chi-Quadrat-Gesamtwert erklärt (65,972). Von den Zeilenkategorien tragen Zoologie (15,194), Physik (12,906) und Technik (10,001) am meisten zum Chi-Quadrat-Gesamtwert bei. Von den Spaltenkategorien tragen die Finanzierungsstufen D (22,899) und E (17,282) am meisten zum Chi-Quadrat-Gesamtwert bei.

Relative Trägheiten

Die Zellenträgheit ist der Chi-Quadrat-Wert in der Zelle dividiert durch die Gesamthäufigkeit für die Kontingenztafel. Die Gesamtträgheit bzw. Trägheit entspricht der Summe aller Zellenträgheiten. Die relative Trägheit für eine Zelle entspricht der Zellenträgheit dividiert durch die Gesamtträgheit. Die relative Trägheit für eine Zeile ist die Summe aller Zellenträgheiten in der Zeile dividiert durch die Gesamtträgheit. Die relative Trägheit für eine Spalte ist die Summe aller Zellenträgheiten in der Spalte dividiert durch die Gesamtträgheit.

Interpretation

Verwenden Sie die relative Trägheit, um die Stärke der Assoziationen zwischen Kategorien sowie die Beiträge zur Streuung in den Daten zu untersuchen. Höhere Werte weisen in der Regel auf eine stärkere Assoziation und einen größeren Anteil an der Gesamtstreuung in den Daten hin.

Relative Trägheiten

ABCDEGesamt
Geologie0,0000,0320,0160,0000,0890,137
Biochemie0,0000,0230,0040,0440,0480,119
Chemie0,0030,0120,0010,0000,0050,021
Zoologie0,0090,0150,0110,1890,0080,230
Physik0,1060,0110,0020,0740,0030,196
Technik0,0010,0110,0380,0010,1020,152
Mikrobiologie0,0020,0000,0000,0030,0050,010
Botanik0,0510,0040,0000,0100,0020,067
Statistik0,0100,0000,0000,0020,0000,012
Mathematik0,0050,0030,0220,0260,0000,056
Gesamt0,1870,1100,0940,3470,2621,000

In der Tabelle „Relative Trägheiten“ wird der relative Beitrag jeder Zelle zur Chi-Quadrat-Gesamtstatistik angezeigt. Je größer die relative Trägheit in einer Zelle, desto stärker ist die Assoziation zwischen den Zeilen- und Spaltenkategorien. In dieser Tabelle weist die Zelle für Zoologie und Finanzierungskategorie D die größte relative Trägheit (0,189) und damit die stärkste Assoziation auf. Die Tabelle gibt auch die relative Gesamtträgheit für jede Zeile und Spalte an.