Observations relatives aux données pour la fonction Test d'association du Khi deux

Pour garantir la validité de vos résultats, examinez les indications suivantes lorsque vous collectez des données, effectuez une analyse et interprétez vos résultats.

Collecter des données récapitulatives ou des données brutes

Vous pouvez utiliser deux colonnes de données brutes ou des données résumées sous forme d'un tableau de contingence. Si vos données sont au format d'effectif, utilisez Tableau à entrées multiples et Khi deux.

Remarque

Les valeurs manquantes ne sont pas autorisées dans les tableaux de contingence.

Les échantillons doivent être sélectionnés de manière aléatoire

Pour chaque niveau de X, vous collectez un échantillon aléatoire d'éléments représentatifs du procédé. Les niveaux de la variable X peuvent représenter différents procédés ou emplacements. Par exemple, si vous possédez plusieurs succursales qui génèrent des factures, vous devez collecter un échantillon de factures pour chaque succursale.

Les échantillons aléatoires permettent de faire des généralisations ou des déductions sur une population. Si les données ne sont pas collectées de manière aléatoire, les résultats risquent de ne pas être valides.

Chaque observation doit être indépendante de toutes les autres

L'indépendance des observations est une hypothèse critique pour le test d'association du Khi deux.

Il doit s'agir de données de catégorie.

Les variables de catégorie ont un nombre fini et dénombrable de catégories ou de groupes distincts. Les données de catégorie peuvent ne pas présenter d'ordre logique. Par exemple, les prédicteurs de catégorie incluent le sexe d'individus, le type de matériel et le mode de paiement.

Toutes les données doivent être catégorisées dans des catégories mutuellement exclusives, sans superposition.

Le test d'association du Khi deux ne peut pas être effectué lorsque des catégories de variables se superposent. Ainsi, chaque observation doit être classée dans une seule catégorie.

Les dénombrements attendus ne doivent pas être trop faibles

Chaque échantillon doit être assez grand pour qu'il y ait des chances raisonnables d'observer des résultats dans chaque catégorie. Si les dénombrements attendus sont trop faibles, la valeur de p pour le test peut être imprécise. Minitab indique si les dénombrements attendus sont trop faibles et quel doit être l'effectif de chaque échantillon pour garantir la validité du test.

Si le dénombrement attendu pour une catégorie est trop faible, vous pouvez peut-être combiner cette catégorie à des catégories adjacentes pour atteindre le dénombrement attendu minimal. Vous devez combiner des catégories uniquement lorsque cela est nécessaire car la combinaison de catégories entraîne la perte d'informations.