Häufigkeiten und Chi-Quadrat-Distanzen für Einfache Korrespondenzanalyse

Hier finden Sie Definitionen und Anleitungen zur Interpretation für alle Statistiken, die für Häufigkeiten und Chi-Quadrat-Distanzen in der einfachen Korrespondenzanalyse bereitgestellt werden.

Kontingenztafel

In der Kontingenztafel werden Beobachtungen nach mehreren kategorialen Variablen ausgezählt. Die Zeilen und Spalten der Tabelle entsprechen den kategorialen Variablen. Die Tafel enthält auch Randsummen für jede Stufe der Variablen.

Die Kontingenztafel für eine einfache Korrespondenzanalyse ist eine Zwei-Weg-Tabelle, in der Beobachtungen nach zwei kategorialen Variablen ausgezählt werden. Sie können Beobachtungen auch nach drei oder vier Variablen kategorisieren, indem Sie mit Hilfe des Unterdialogfelds Kombinieren die Variablen kreuzen und die Zeilen und/oder Spalten einer Zwei-Weg-Tabelle erstellen.

Interpretation

Verwenden Sie die Kontingenztafel, um die erwartete Häufigkeit für jede Zelle anzuzeigen, die durch eine Zeilenkategorie und eine Spaltenkategorie definiert ist. Verwenden Sie die Spalten- und Zeilensummen, um die Gesamthäufigkeit für jede Kategorie zu erfahren.

Kontingenztafel A B C D E Gesamt Geologie 3,000 19,000 39,000 14,000 10,000 85,000 Biochemie 1,000 2,000 13,000 1,000 12,000 29,000 Chemie 6,000 25,000 49,000 21,000 29,000 130,000 Zoologie 3,000 15,000 41,000 35,000 26,000 120,000 Physik 10,000 22,000 47,000 9,000 26,000 114,000 Technik 3,000 11,000 25,000 15,000 34,000 88,000 Mikrobiologie 1,000 6,000 14,000 5,000 11,000 37,000 Botanik 0,000 12,000 34,000 17,000 23,000 86,000 Statistik 2,000 5,000 11,000 4,000 7,000 29,000 Mathematik 2,000 11,000 37,000 8,000 20,000 78,000 Gesamt 31,000 128,000 310,000 129,000 198,000 796,000

In der folgenden Zwei-Weg-Kontingenztafel werden die beobachteten Häufigkeiten der Forscher in den einzelnen akademischen Fachgebieten und Finanzierungskategorien (A, B, C, D, E) angezeigt. Die Summenspalte zeigt, dass die meisten Forscher auf den Gebieten Chemie (130), Zoologie (120) und Physik (114) vorhanden sind. Die Summenzeile gibt an, dass die meisten Forscher in Finanzierungskategorie C klassifiziert wurden (310). Bei den Häufigkeiten in den Zellen weisen Chemiker, die in Finanzierungskategorie C klassifiziert wurden, die größte beobachtete Häufigkeit auf (49).

Erwartete Häufigkeiten

Die erwartete Häufigkeit ist die in einer Zelle durchschnittlich zu erwartende Anzahl von Beobachtungen, wenn die Variablen unabhängig sind. Minitab berechnet die erwarteten Anzahlen als das Produkt aus den Zeilen- und Spaltensummen geteilt durch die Gesamtzahl der Beobachtungen.

Erwartete Häufigkeiten A B C D E Geologie 3,310 13,668 33,103 13,775 21,143 Biochemie 1,129 4,663 11,294 4,700 7,214 Chemie 5,063 20,905 50,628 21,068 32,337 Zoologie 4,673 19,296 46,734 19,447 29,849 Physik 4,440 18,332 44,397 18,475 28,357 Technik 3,427 14,151 34,271 14,261 21,889 Mikrobiologie 1,441 5,950 14,410 5,996 9,204 Botanik 3,349 13,829 33,492 13,937 21,392 Statistik 1,129 4,663 11,294 4,700 7,214 Mathematik 3,038 12,543 30,377 12,641 19,402

In der folgenden Tabelle der erwarteten Häufigkeiten werden die erwarteten Anzahlen der Forscher in den einzelnen akademischen Fachgebieten und Finanzierungskategorien (A, B, C, D, E) angezeigt; dabei wird davon ausgegangen, dass Finanzierung und akademisches Fachgebiet unabhängig voneinander sind. Da die meisten Forscher in der Chemie tätig sind und sich die meisten Fachgebiete in der Finanzierungskategorie C befinden, weist die Kombination dieser Kategorien den höchsten Wert auf (ca. 51).

Beobachtete – erwartete Häufigkeiten

Beobachtete – erwartete Häufigkeiten ist die Differenz zwischen der tatsächlichen Anzahl der Beobachtungen in der Zelle und der Anzahl der Beobachtungen in der Zelle, die Sie erwarten würden, wenn die Variablen unabhängig wären.

Interpretation

Verwenden Sie die Differenz zwischen den beobachteten und den erwarteten Werten, um nach Anzeichen für mögliche Assoziationen in den Daten zu suchen. Wenn eine Assoziation zwischen zwei Variablen besteht, variiert die Verteilung der Beobachtungen für eine Variable abhängig von der Kategorie der zweiten Variablen. Im Ergebnis ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Häufigkeit relativ groß. Wenn keine Assoziation zwischen den beiden Variablen besteht, ähneln sich die Verteilungen der Beobachtungen für eine Variable bei allen Kategorien der zweiten Variablen. Im Ergebnis ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Häufigkeit relativ klein.

Beobachtete - erwartete Häufigkeiten A B C D E Geologie -0,310 5,332 5,897 0,225 -11,143 Biochemie -0,129 -2,663 1,706 -3,700 4,786 Chemie 0,937 4,095 -1,628 -0,068 -3,337 Zoologie -1,673 -4,296 -5,734 15,553 -3,849 Physik 5,560 3,668 2,603 -9,475 -2,357 Technik -0,427 -3,151 -9,271 0,739 12,111 Mikrobiologie -0,441 0,050 -0,410 -0,996 1,796 Botanik -3,349 -1,829 0,508 3,063 1,608 Statistik 0,871 0,337 -0,294 -0,700 -0,214 Mathematik -1,038 -1,543 6,623 -4,641 0,598

In dieser Tabelle ist der Betrag der Differenz zwischen der beobachteten und der erwarteten Anzahl für Zoologie und Finanzierungskategorie D (15,553) sowie für Technik und Finanzierungskategorie E (12,111) relativ groß. Bei diesen Zellen sind die beobachteten Anzahlen größer als die Anzahl, die Sie erwarten würden, wenn die Variablen unabhängig wären. Der Betrag der Differenz ist auch für Geologie und Finanzierungskategorie E relativ groß (-11,143). Bei dieser Zelle ist die beobachtete Anzahl kleiner als die Anzahl, die Sie bei unabhängigen Variablen erwarten würden. Sie können daher schlussfolgern, dass deutlich mehr Abteilungen der Ingenieurswissenschaften und deutlich weniger Geologieabteilungen unfinanziert waren als erwartet.

Chi-Quadrat-Distanzen

Minitab zeigt den Beitrag jeder Zelle zur Chi-Quadrat-Statistik als Chi-Quadrat-Distanz an. Die Chi-Quadrat-Distanz für jede Zelle gibt an, welcher Anteil an der Chi-Quadrat-Gesamtstatistik auf die Abweichung der jeweiligen Zelle zurückzuführen ist.

Minitab berechnet den Beitrag jeder Zelle zur Chi-Quadrat-Statistik als Quadrat der Differenz zwischen dem beobachteten und dem erwarteten Wert für eine Zelle dividiert durch den erwarteten Wert für die betreffende Zelle. Die Chi-Quadrat-Gesamtstatistik stellt die Summe aus diesen Werten für alle Zellen dar.

Interpretation

Sie können die Chi-Quadrat-Distanzen für die einzelnen Zellen vergleichen, um zu untersuchen, welche Zellen am meisten zum Chi-Quadrat-Gesamtwert beitragen. Wenn die beobachtete und die erwartete Zellenhäufigkeit stark voneinander abweichen, ist der Chi-Quadrat-Wert für die Zelle größer. Eine größere Chi-Quadrat-Distanz in einer Zelle weist daher auf eine stärkere Assoziation zwischen den Zeilen- und Spaltenkategorien hin, als zufällig zu erwarten wäre.

Chi-Quadrat-Distanzen A B C D E Gesamt Geologie 0,029 2,080 1,050 0,004 5,873 9,036 Biochemie 0,015 1,521 0,258 2,913 3,176 7,882 Chemie 0,173 0,802 0,052 0,000 0,344 1,373 Zoologie 0,599 0,957 0,703 12,438 0,496 15,194 Physik 6,964 0,734 0,153 4,859 0,196 12,906 Technik 0,053 0,702 2,508 0,038 6,700 10,001 Mikrobiologie 0,135 0,000 0,012 0,166 0,351 0,663 Botanik 3,349 0,242 0,008 0,673 0,121 4,393 Statistik 0,671 0,024 0,008 0,104 0,006 0,814 Mathematik 0,354 0,190 1,444 1,704 0,018 3,710 Gesamt 12,343 7,252 6,196 22,899 17,282 65,972

In dieser Tabelle beträgt der Wert für Zoologie und Finanzierungskategorie D 12,438; damit wird der größte Beitrag zum Chi-Quadrat-Gesamtwert erklärt (65,972). Von den Zeilenkategorien tragen Zoologie (15,194), Physik (12,906) und Technik (10,001) am meisten zum Chi-Quadrat-Gesamtwert bei. Von den Spaltenkategorien tragen die Finanzierungsstufen D (22,899) und E (17,282) am meisten zum Chi-Quadrat-Gesamtwert bei.

Relative Trägheiten

Die Zellenträgheit ist der Chi-Quadrat-Wert in der Zelle dividiert durch die Gesamthäufigkeit für die Kontingenztafel. Die Gesamtträgheit bzw. Trägheit entspricht der Summe aller Zellenträgheiten. Die relative Trägheit für eine Zelle entspricht der Zellenträgheit dividiert durch die Gesamtträgheit. Die relative Trägheit für eine Zeile ist die Summe aller Zellenträgheiten in der Zeile dividiert durch die Gesamtträgheit. Die relative Trägheit für eine Spalte ist die Summe aller Zellenträgheiten in der Spalte dividiert durch die Gesamtträgheit.

Interpretation

Verwenden Sie die relative Trägheit, um die Stärke der Assoziationen zwischen Kategorien sowie die Beiträge zur Streuung in den Daten zu untersuchen. Höhere Werte weisen in der Regel auf eine stärkere Assoziation und einen größeren Anteil an der Gesamtstreuung in den Daten hin.

Relative Trägheiten A B C D E Gesamt Geologie 0,000 0,032 0,016 0,000 0,089 0,137 Biochemie 0,000 0,023 0,004 0,044 0,048 0,119 Chemie 0,003 0,012 0,001 0,000 0,005 0,021 Zoologie 0,009 0,015 0,011 0,189 0,008 0,230 Physik 0,106 0,011 0,002 0,074 0,003 0,196 Technik 0,001 0,011 0,038 0,001 0,102 0,152 Mikrobiologie 0,002 0,000 0,000 0,003 0,005 0,010 Botanik 0,051 0,004 0,000 0,010 0,002 0,067 Statistik 0,010 0,000 0,000 0,002 0,000 0,012 Mathematik 0,005 0,003 0,022 0,026 0,000 0,056 Gesamt 0,187 0,110 0,094 0,347 0,262 1,000

In der Tabelle „Relative Trägheiten“ wird der relative Beitrag jeder Zelle zur Chi-Quadrat-Gesamtstatistik angezeigt. Je größer die relative Trägheit in einer Zelle, desto stärker ist die Assoziation zwischen den Zeilen- und Spaltenkategorien. In dieser Tabelle weist die Zelle für Zoologie und Finanzierungskategorie D die größte relative Trägheit (0,189) und damit die stärkste Assoziation auf. Die Tabelle gibt auch die relative Gesamtträgheit für jede Zeile und Spalte an.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien