Angenommen, eine Kontingenztafel enthält r Zeilen und c Spalten. Der Eintrag nij in Zeile i und Spalte j der Kontingenztafel ist die Häufigkeit für diese Zelle. Die Summe von Zeile i, ni., ist die Summe der Häufigkeiten in Zeile i. Die Summe von Spalte j, n.j, ist die Summe der Häufigkeiten in Spalte j. Die Summe der Tabelle, n.. oder einfach n, ist die Summe aller Häufigkeiten in der Tabelle.
Profile sind Anteile, die anhand der Häufigkeiten (nij) in der ursprünglichen Kontingenztafel berechnet werden. Das Profil für Zeile i entspricht demnach (ni1 / ni., ..., nic / ni.); das Profil für Spalte j entspricht (n1j / n.j, ..., nrj / n.j).
Das durchschnittliche Zeilenprofil wird aus den Spaltensummen berechnet. Das durchschnittliche Zeilenprofil entspricht demnach (n.1 / n, ..., n.c / n). Analog dazu wird das durchschnittliche Spaltenprofil aus den Zeilensummen berechnet. Das durchschnittliche Spaltenprofil entspricht demnach (n1. / n, ..., nr. / n).
Wenn die beobachtete und die erwartete Zellenhäufigkeit stark voneinander abweichen, ist der χ2-Wert für die Zelle groß.
Die χ2-Statistik ist die Summe der χ2-Werte in allen Zellen der Tabelle. Mit dieser Statistik wird Abweichung von der Homogenität der Zeilenprofile bzw. der Spaltenprofile gemessen. Wenn die Zeilen- bzw. Spaltenprofile stark von einander abweichen, ist die χ2-Statistik groß. Die χ2-Statistik kann auch als Maß dafür angesehen werden, wie stark die Zeilen- bzw. Spaltenprofile vom durchschnittlichen Zeilen- bzw. Spaltenprofil abweichen.
Begriff | Beschreibung |
---|---|
nij | beobachtete Häufigkeit in der Zelle |
eij | erwartete Häufigkeit in der Zelle |