Überlegungen zu Daten für Chi-Quadrat-Test auf Assoziation

Befolgen Sie beim Erfassen von Daten, Durchführen der Analyse und Interpretieren der Ergebnisse die folgenden Richtlinien, um sicherzustellen, dass die Ergebnisse gültig sind.

Erfassen Sie Rohdaten oder zusammenfassende Daten

Sie können zwei Spalten mit Rohdaten oder zusammengefassten Daten in Form einer Kontingenztafel verwenden. Wenn Ihre Daten im Häufigkeitenformat vorliegen, verwenden Sie Kreuztabelle und Chi-Quadrat-Test.

Hinweis

Fehlende Werte sind in einer Kontingenztafel nicht zulässig.

Die Stichprobe sollte nach dem Zufallsprinzip ausgewählt werden

Erfassen Sie für jede Stufe von x eine zufällige Stichprobe von Einheiten, die repräsentativ für den Prozess sind. Die Stufen der x-Variable können unterschiedliche Prozesse oder Standorte darstellen. Wenn z. B. in mehreren Niederlassungen Rechnungen bearbeitet werden, sollten Sie für jede Niederlassung eine Stichprobe aus den Rechnungen ziehen.

Mit Zufallsstichproben werden Verallgemeinerungen zu einer Grundgesamtheit angestellt und Schlussfolgerungen zu dieser gezogen. Wenn die Daten nicht nach dem Zufallsprinzip erfasst wurden, sind die Ergebnisse u. U. ungültig.

Jede Beobachtung sollte unabhängig von allen anderen Beobachtungen sein

Die Unabhängigkeit der Beobachtungen ist eine kritische Annahme für den Chi-Quadrat-Test auf Assoziation.

Daten müssen kategorial sein

Kategoriale Variablen umfassen eine endliche, zählbare Anzahl von Kategorien oder eindeutigen Gruppen. Kategoriale Daten müssen nicht zwangsläufig eine logische Reihenfolge aufweisen. Zu den kategorialen Prädiktoren zählen beispielsweise Geschlecht, Materialtyp und Zahlungsmethode.

Alle Daten müssen in überschneidungsfreien Kategorien eingeordnet sein

Der Chi-Quadrat-Test auf Assoziation kann nicht ausgeführt werden, wenn sich die Kategorien der Variablen überschneiden. Daher darf jede Beobachtung nur in genau einer Kategorie eingeordnet sein.

Die erwarteten Anzahlen dürfen nicht zu klein sein

Jede Stichprobe sollte groß genug sein, dass mit einer angemessenen Wahrscheinlichkeit Ergebnisse in jeder Kategorie beobachtet werden. Wenn die erwarteten Häufigkeiten (Anzahlen) zu gering sind, ist der p-Wert für den Test möglicherweise ungenau. Minitab gibt an, ob die erwarteten Anzahlen zu gering sind und wie groß die einzelnen Stichproben sein sollten, um die Gültigkeit des Tests sicherzustellen.

Wenn die erwartete Anzahl für eine Kategorie zu gering ist, können Sie die betreffende Kategorie u. U. mit angrenzenden Kategorien zusammenfassen, um die mindestens erforderliche Anzahl zu erhalten. Sie sollten Kategorien nur bei Bedarf kombinieren, da beim Kombinieren der Kategorien Informationen verloren gehen.