Beispiel für Einfache Korrespondenzanalyse

Ein Forschungsleiter an einer Universität möchte zehn akademische Fachrichtungen in Bezug auf fünf verschiedene Finanzierungsgrade vergleichen. Der Forschungsleiter sammelt Kreuzklassifikationsdaten zu 796 Forschern.

Für diese Kreuzklassifikation sind die akademischen Fachrichtungen in Zeilen und die Finanzierungsgrade in Spalten angeordnet. A ist die Kategorie mit dem höchsten und D mit dem niedrigsten Finanzierungsgrad, während Kategorie E gar keine Finanzierung erhält. Der Forschungsleiter führt eine einfache Korrespondenzanalyse durch, um die Assoziationen zwischen den Zeilen und Spalten darzustellen.

Der Manager möchte auch zusätzliche Daten untersuchen, die nicht Teil des Hauptdatensatzes sind. Die zusätzlichen Daten umfassen eine zusätzliche Zeile für Museumswissenschaftler sowie eine Zeile für Mathematikwissenschaft, in der Mathematik und Statistik zusammengefasst sind.

  1. Öffnen Sie den Beispieldatensatz Forschungsfinanzierung.MTW.
  2. Wählen Sie Statistik > Multivariate Analysen > Einfache Korrespondenzanalyse aus.
  3. Wählen Sie unter Eingabedaten die Option Spalten einer Kontingenztafel aus, und geben Sie die Spalten CT1-CT5 ein. Geben Sie im Feld Zeilennamen die Spalte Zeilennamen ein. Geben Sie im Feld Spaltennamen die Spalte Spaltennamen ein.
  4. Klicken Sie auf Ergebnisse, und wählen Sie Zeilenprofile aus. Klicken Sie auf OK.
  5. Klicken Sie auf Zusätzliche Daten. Geben Sie im Feld Zusätzliche Zeilen die Spalten ZeilZusatz1 ZeilZusatz2 ein. Geben Sie im Feld Zeilennamen die Spalte ZZNamen ein. Klicken Sie auf OK.
  6. Klicken Sie auf Grafiken. Wählen Sie Zusätzliche Punkte in allen Diagrammen anzeigen aus. Wählen Sie Symmetrische Diagramme nur mit Zeilen und Asymmetrisches Zeilendiagramm mit Zeilen und Spalten aus.
  7. Klicken Sie in den einzelnen Dialogfeldern auf OK.

Interpretieren der Ergebnisse

Die Tabelle „Zeilenprofile“ enthält die Anteile jeder Zeilenkategorie nach Spalte. Bei der Geologie befinden sich beispielsweise 3,5 % der Forscher in Finanzierungskategorie A, 22,4 % in Finanzierungskategorie B usw. Die Masse für die einzelnen Zeilen gibt den Anteil der Forscher am gesamten Datensatz an. Die Masse für Geologie beträgt z. B. 0,107; dieser Wert gibt an, dass 10,7 % der Forscher auf dem Gebiet der Geologie tätig sind.

Anhand der Werte in den Tabellen „Zeilenbeiträge“ und „Spaltenbeiträge“ können Sie die verschiedenen Komponenten interpretieren. Die Spalte „Qual“ (Qualität) gibt den durch die beiden Komponenten dargestellten Anteil an der Trägheit an.

Bei den Zeilenbeiträgen werden z. B. die Felder Zoologie (0,929) und Geologie (0,916) durch die Aufschlüsselung nach zwei Komponenten am besten dargestellt. Mathematik wird mit einem Qualitätswert von 0,319 am schlechtesten dargestellt. Bei den Spaltenbeiträgen erklären die beiden Komponenten den größten Teil der Streuung in den Finanzierungskategorien B, D und E. Die finanzierten Kategorien A, B, C und D tragen am stärksten zu Komponente 1 bei, während die unfinanzierte Kategorie E am stärksten zu Komponente 2 beiträgt.

Das Zeilendiagramm zeigt die Hauptkoordinaten in Zeilen an. Komponente 1, durch die Zoologie und Physik am besten erklärt werden, zeigt diese beiden Felder am weitesten entfernt vom Ursprung, jedoch mit umgekehrten Vorzeichen an. Komponente 1 stellt also die biologischen Wissenschaften Zoologie und Botanik der Physik gegenüber. Komponente 2 stellt Biochemie und Technik der Geologie gegenüber.

Im asymmetrischen Zeilendiagramm werden die Zeilen in Hauptkoordinaten und die Spalten in standardisierten Koordinaten skaliert. Bezüglich der Finanzierungskategorien stellt Komponente 1 unterschiedliche Stufen der Finanzierung gegenüber, während Komponente 2 eine vorhandene Finanzierung (A bis D) keiner Finanzierung (E) gegenüberstellt. Physik weist tendenziell die höchste Finanzierung auf, während die Finanzierung in der Zoologie tendenziell am geringsten ist. Biochemie weist eine durchschnittliche Finanzierung auf, verfügt jedoch über den höchsten Anteil unfinanzierter Forschungen. Zwar werden auch Museen finanziert, jedoch bewegt sich die Finanzierung hier verglichen mit der akademischen Forschung auf einem niedrigeren Niveau.

Zeilenprofile

ABCDEMasse
Geologie0,0350,2240,4590,1650,1180,107
Biochemie0,0340,0690,4480,0340,4140,036
Chemie0,0460,1920,3770,1620,2230,163
Zoologie0,0250,1250,3420,2920,2170,151
Physik0,0880,1930,4120,0790,2280,143
Technik0,0340,1250,2840,1700,3860,111
Mikrobiologie0,0270,1620,3780,1350,2970,046
Botanik0,0000,1400,3950,1980,2670,108
Statistik0,0690,1720,3790,1380,2410,036
Mathematik0,0260,1410,4740,1030,2560,098
Masse0,0390,1610,3890,1620,249 

Analyse der Kontingenztafel

AchseTrägheitAnteilKumulativ
10,03910,47200,4720
20,03040,36660,8385
30,01090,13110,9697
40,00250,03031,0000
Gesamt0,0829   

Zeilenbeiträge






Komponente 1
IDNameQualMasseTrägeKoordKomp.-BeitragBeitrag
1Geologie0,9160,1070,137-0,0760,0550,016
2Biochemie0,8810,0360,119-0,1800,1190,030
3Chemie0,6440,1630,021-0,0380,1340,006
4Zoologie0,9290,1510,2300,3270,8460,413
5Physik0,8860,1430,196-0,3160,8800,365
6Technik0,8700,1110,1520,1170,1210,039
7Mikrobiologie0,6800,0460,010-0,0130,0090,000
8Botanik0,6540,1080,0670,1790,6250,088
9Statistik0,5610,0360,012-0,1250,5540,014
10Mathematik0,3190,0980,056-0,1070,2400,029


Komponente 2
IDNameKoordKomp.-BeitragBeitrag
1Geologie-0,3030,8610,322
2Biochemie0,4550,7620,248
3Chemie-0,0730,5100,029
4Zoologie-0,1020,0830,052
5Physik-0,0270,0060,003
6Technik0,2920,7490,310
7Mikrobiologie0,1100,6710,018
8Botanik0,0390,0290,005
9Statistik-0,0140,0070,000
10Mathematik0,0610,0790,012

Zusätzliche Zeilen






Komponente 1
IDNameQualMasseTrägeKoordKomp.-BeitragBeitrag
1Museen0,5560,0670,3530,3140,2250,168
2MathWiss0,5590,1340,041-0,1120,4930,043


Komponente 2
IDNameKoordKomp.-BeitragBeitrag
1Museen-0,3810,3310,318
2MathWiss0,0410,0660,007

Spaltenbeiträge






Komponente 1Komponente 2
IDNameQualMasseTrägeKoordKomp.-BeitragBeitragKoordKomp.-BeitragBeitrag
1A0,5870,0390,187-0,4780,5740,228-0,0720,0130,007
2B0,8160,1610,110-0,1270,2860,067-0,1730,5310,159
3C0,4650,3890,094-0,0830,3410,068-0,0500,1240,032
4D0,9680,1620,3470,3900,8590,632-0,1390,1090,103
5E0,9900,2490,2620,0320,0120,0060,2920,9780,699