Qu'est-ce que la statistique du Khi deux ?

La statistique du Khi deux est une mesure de la divergence entre la loi de distribution de vos données et une loi attendue ou hypothétisée que vous avez choisie. Elle permet, par exemple, d'effectuer les opérations suivantes :
  • Tester l'indépendance de variables de catégorie ou déterminer leur association. Par exemple, si vous disposez d'un tableau à deux entrées comportant les résultats d'une élection en fonction du sexe des votants, la statistique du Khi deux permet de déterminer si un vote est indépendant du sexe des votants ou s'il existe une association quelconque entre le vote et le sexe des votants. Si la valeur de p associée à la statistique du Khi deux est inférieure au niveau d'α que vous avez sélectionné, le test rejette alors l'hypothèse nulle selon laquelle les deux variables sont indépendantes.
  • Déterminer si un modèle statistique est correctement ajusté aux données. Si la valeur de p associée à la statistique du Khi deux est inférieure au niveau d'α que vous avez sélectionné, le test rejette alors l'hypothèse nulle selon laquelle le modèle est correctement ajusté aux données.

Pour les données de catégorie, Minitab peut indiquer la contribution de chaque catégorie à la valeur du Khi deux, ce qui permet de quantifier la part de la valeur totale du Khi deux attribuable à la divergence de chaque catégorie. Par exemple, si le test d'ajustement rejette l'hypothèse nulle, ce résultat est-il dû au fait que toutes les catégories diffèrent modérément de leurs prévisions ou est-il dû au fait qu'une seule catégorie diffère fortement de sa prévision ? Par exemple, supposons que vous prévoyiez un échantillon de 100 voitures dans un très grand parking contenant 50 berlines, 27 camions et 23 fourgonnettes, mais qu'à la place il contienne 61 berlines, 16 camions et 23 fourgonnettes. Les catégories "berlines" et "camions" ne correspondent pas à leurs prévisions mais la catégorie "fourgonnettes" oui. Par conséquent, la catégorie "fourgonnettes" ne contribue en rien au résultat de la valeur du Khi deux ; toutes les divergences de données proviennent des catégories "berlines" et "camions".

Remarque

Minitab n'utilise pas le facteur de correction de Yates lors du calcul de la statistique du Khi deux.