Plusieurs options s'offrent à vous lorsque vous souhaitez réaliser un test d'hypothèse avec des données non normales.
Bien que de nombreux tests d'hypothèse soient en théorie fondés sur l'hypothèse de normalité, vous pouvez tout de même obtenir de bons résultats avec des données non normales si votre échantillon est assez grand. La quantité de données nécessaire dépend du degré de non-normalité de vos données, mais un effectif d'échantillon de 20 est souvent adéquat. La relation entre la robustesse à la normalité et l'effectif de l'échantillon est définie par le théorème central limite. Ce théorème démontre que la distribution de la moyenne des données se rapproche de la loi normale au fur et à mesure que l'effectif de l'échantillon augmente, ce, quelle que soit la loi à laquelle obéissent les données. Par conséquent, pour faire une inférence sur une moyenne de population, l'hypothèse de normalité n'est pas essentielle tant que votre échantillon est suffisamment grand.
Les tests paramétriques ne partent pas de l'hypothèse selon laquelle la population obéit à une loi spécifique. Minitab propose plusieurs tests non paramétriques que vous pouvez utiliser à la place de tests qui s'appuient sur l'hypothèse de normalité. Ces tests peuvent être particulièrement utiles si votre échantillon est petit et asymétrique, ou s'il contient plusieurs valeurs aberrantes.
Test supposant la normalité | Tests non paramétriques équivalents |
---|---|
Tests Z et t à 1 échantillon | Tests des signes et de Wilcoxon à 1 échantillon |
Test t à 2 échantillons | Mann-Whitney |
ANOVA | Kruskal-Wallis, test de Mood pour les médianes, Friedman |
Dans les tests non paramétriques, vos données reposent également sur des hypothèses : par exemple, votre échantillon de données doit quand même être aléatoire et indépendant.
Parfois, vous pouvez transformer vos données en leur appliquant une fonction destinée à leur faire suivre une loi normale pour pouvoir finir votre analyse.