Zeilen- und Spaltenbeiträge für Einfache Korrespondenzanalyse

Hauptkoordinaten in Spalten

Die Spaltenprofile liegen in einem d-dimensionalen Raum. Dieser Raum wird von dem vollständigen Satz der d Hauptachsen aufgespannt. Angenommen, g_j1, g_j2, g_j3, ..., g_jd sind die Koordinaten von Spaltenprofil j auf den Hauptachsen. Diese Koordinaten werden als Hauptkoordinaten in Spalten bezeichnet. Die k-te Hauptkoordinate für das Spaltenprofil j ist g_jk.

Der beste k-dimensionale Unterraum wird von den ersten k Hauptachsen aufgespannt. Wenn Spaltenprofil j auf den besten k-dimensionalen Unterraum projiziert wird, sind g_j1, ..., g_jk die Hauptkoordinaten in Spalten für das Profil in diesem Unterraum.

Korrelation

Jede Hauptachse trägt zur Trägheit jeder Zeile bei. Die Korrelation für Zeile i und Komponente k entspricht dem Beitrag von Hauptachse k zur Trägheit von Zeile i, ausgedrückt als Prozentsatz der Trägheit von Zeile i.

Die Korrelation kann auch als Korrelation zwischen Zeilenprofil i und Hauptkomponente k betrachtet werden. Diese Korrelation wird folgendermaßen berechnet:

Analog dazu entspricht die Korrelation für Spalte j und Komponente k dem Beitrag von Hauptachse k zur Spalte j, ausgedrückt als Prozentsatz der Trägheit von Spalte j.

Die Korrelation kann auch als Korrelation zwischen Spaltenprofil j und Hauptkomponente k betrachtet werden. Diese Korrelation wird folgendermaßen berechnet:

Minitab zeigt die relative Trägheit für eine bestimmte Zeile oder Spalte an. Die absolute Trägheit ist das Produkt aus der relativen Trägheit und der Gesamtträgheit.

Die Summe der Korrelationen für Zeile i (Spalte j) über alle Hauptkomponenten beträgt 1. Die Summe über die ersten k Hauptkoordinaten entspricht der Qualität für das Zeilenprofil i (Spaltenprofil j) und dem besten k-dimensionalen Unterraum.

Notation

Begriff	Beschreibung
f_ik	k-te Hauptkoordinate für das Zeilenprofil i
g_jk	k-te Hauptkoordinate für das Spaltenprofil j

Trägheit und Zellenträgheit

Die Trägheit in einer Zelle wird wie folgt berechnet:

Die Summe aller Zellenträgheiten ist die Gesamtträgheit für die Tabelle, die gelegentlich einfach als Trägheit bezeichnet wird.

Die relative Trägheit für eine Zelle wird wie folgt berechnet:

Hauptachsen (Hauptkomponenten)

Die Zeilenprofile liegen in einem c-dimensionalen Raum. Die Hauptkomponenten, auch als Hauptachsen bezeichnet, spannen Unterräume mit weniger Dimensionen auf. Als erste Hauptachse wird der Vektor im c-dimensionalen Raum ausgewählt, der den größten Teil der Gesamtträgheit erklärt. Die erste Hauptachse spannt daher den besten eindimensionalen Unterraum auf (also den, der gemäß eines geeigneten Maßes am nächsten an den Profilen liegt). Als zweite Hauptachse wird der Vektor im c-dimensionalen Raum ausgewählt, der den größten Teil der verbleibenden Trägheit erklärt. Die ersten zwei Hauptachsen spannen also den besten zweidimensionalen Unterraum auf. Als dritte Hauptachse wird der Vektor im c-dimensionalen Raum ausgewählt, der den größten Teil der nach Abzug der durch die ersten beiden Achsen erklärten Trägheit verbleibenden Trägheit erklärt. Die ersten drei Hauptachsen spannen also den besten dreidimensionalen Unterraum auf.

Sei d = der kleinere der beiden Werte (r – 1) und (c – 1). Die Zeilenprofile (bzw. die Spaltenprofile) liegen tatsächlich in einem d-dimensionalen Unterraum des vollständigen c-dimensionalen Raums (bzw. des vollständigen r-dimensionalen Raums). Daher sind maximal d Hauptachsen vorhanden.

Qualität

Die Qualität für das Zeilenprofil i und der beste k-dimensionale Unterraum werden wie folgt berechnet:

Die Qualität für das Spaltenprofil j und der beste k-dimensionale Unterraum werden wie folgt berechnet:

Die Qualität ist immer eine Zahl zwischen 0 und 1, wobei höhere Zahlen bessere Approximationen angeben.

Notation

Begriff	Beschreibung
f_ik	k-te Hauptkoordinate für das Zeilenprofil i
g_jk	k-te Hauptkoordinate für das Spaltenprofil j

Relativer Beitrag zur Gesamtträgheit

Der Beitrag einer Zeile zur Gesamtträgheit entspricht der Summe aller Zellenträgheiten in der Zeile. Der relative Beitrag einer Zeile zur Gesamtträgheit wird folgendermaßen berechnet:

Der Beitrag einer Spalte zur Gesamtträgheit entspricht der Summe aller Zellenträgheiten in der Spalte. Der relative Beitrag einer Spalte zur Gesamtträgheit wird folgendermaßen berechnet:

Zeilen- und Spaltenbeiträge

Jede Zeile trägt zur Trägheit jeder Achse bei. Der Beitrag von Zeile i zu Achse k, ausgedrückt als Prozentsatz der Trägheit für Achse k, wird folgendermaßen berechnet:

Die Summe der Beiträge für Hauptachse k über alle Zeilen i beträgt 1.

Analog dazu trägt jede Spalte zur Trägheit jeder Achse bei. Der Beitrag von Spalte j zu Achse k, ausgedrückt als Prozentsatz der Trägheit für Achse k, wird folgendermaßen berechnet:

Die Summe der Beiträge für Hauptachse k über alle Spalten j beträgt 1.

Notation

Begriff	Beschreibung
f_ik	k-te Hauptkoordinate für das Zeilenprofil i
g_jk	k-te Hauptkoordinate für das Spaltenprofil j

Zeilen- und Spaltenmasse

Die Masse für Zeile i wird wie folgt berechnet:

Die Masse für Spalte j wird wie folgt berechnet:

Der Vektor von r Zeilenmassen ist gleich dem durchschnittlichen Zeilenprofil, und der Vektor von c Spaltenmassen ist gleich dem durchschnittlichen Spaltenprofil.