Explication du test de l'égalité des variances

Sur ce thème

Qu'est-ce qu'un test de l'égalité des variances ?
Sur quel test dois-je fonder ma conclusion ?
Test F et test de Bartlett

Qu'est-ce qu'un test de l'égalité des variances ?

Un test de l'égalité des variances permet de vérifier l'égalité des variances entre des populations ou des niveaux de facteurs. De nombreuses méthodes statistiques, telles que l'analyse de la variance (ANOVA) et la régression, supposent que, même s'ils proviennent de populations ayant des moyennes différentes, des échantillons différents ont des variances égales.

Etant donné que la sensibilité à l'inégalité des variances varie sensiblement d'une procédure à l'autre, la nécessité d'effectuer un test de l'égalité des variances est également variable. Par exemple, les inférences d'une ANOVA ne sont que faiblement affectées par l'inégalité des variances si le modèle ne contient que des facteurs fixes avec des effectifs d'échantillons égaux ou presque égaux. A l'inverse, les modèles ANOVA avec des effets aléatoires et/ou des effectifs d'échantillons inégaux peuvent être sensiblement affectés.

Par exemple, vous envisagez d'effectuer un test ANOVA sur la durée de mise en attente des appelants, dans lequel le facteur fixe principal est le centre d'appels. Vous utilisez le modèle linéaire général (MLG) ANOVA, car les effectifs d'échantillons sont inégaux. Etant donné que cette condition non équilibrée augmente la sensibilité à l'inégalité des variances, vous décidez de tester l'hypothèse de l'égalité des variances. Si la valeur de p obtenue est supérieure aux niveaux d'alpha adéquats que vous avez choisis, ne rejetez pas l'hypothèse nulle selon laquelle les variances sont égales. Vous pouvez être sûr que l'hypothèse de l'égalité des variances est satisfaite.

Les hypothèses du test de l'égalité des variances sont les suivantes :

H₀ : toutes les variances sont égales
H₁ : toutes les variances ne sont pas égales

Sur quel test dois-je fonder ma conclusion ?

Par défaut, la commande du test d'égalité des variances de Minitab affiche les résultats de la méthode de Levene et de la méthode de comparaisons multiples. Pour la plupart des lois continues, ces deux méthodes indiquent un taux d'erreur de 1ère espèce proche du seuil de signification spécifié (également appelé alpha ou α). La méthode de comparaisons multiples est généralement plus puissante. Si la valeur de p pour la méthode de comparaisons multiples est significative, vous pouvez alors utiliser le diagramme récapitulatif pour identifier des populations spécifiques présentant des écarts types qui diffèrent les uns des autres. Vous devez fonder vos conclusions sur les résultats de la méthode de comparaisons multiples, à moins que les affirmations suivantes ne soient vraies :  

Vos échantillons contiennent chacun moins de 20 observations.
La loi de distribution d'une ou de plusieurs des populations est très asymétrique, ou ses queues sont lourdes. Contrairement à la loi normale, une loi à queues lourdes comporte un plus grand nombre de données à ses extrémités inférieure et supérieure.

Lorsque vous disposez de petits échantillons provenant de lois très asymétriques ou à extrémités lourdes, le taux d'erreur de 1ère espèce pour la méthode de comparaisons multiples peut être supérieur à α. Dans ces conditions, si la méthode de Levene vous donne une valeur de p plus faible que la méthode de comparaisons multiples, vous devez fonder vos conclusions sur la méthode de Levene. Vous pouvez également fonder vos conclusions sur la méthode de comparaisons multiples, mais souvenez-vous dans ce cas qu'il est probable que votre taux d'erreur de 1ère espèce soit supérieur à α.

Test F et test de Bartlett

Au lieu d'utiliser les méthodes de comparaisons multiples et de Levene, vous pouvez afficher les résultats du test fondé sur la loi normale. Si vous disposez uniquement de 2 groupes ou niveaux de facteur, Minitab effectue le test F. Si vous disposez d'au moins 3 groupes ou niveaux de facteur, Minitab effectue le test de Bartlett.

Le test F et le test de Bartlett ne sont exacts qu'avec des données normalement distribuées. En cas d'écart par rapport à la normalité, ces tests peuvent générer des résultats inexacts. Toutefois, si les données suivent la loi normale, le test F et le test de Bartlett sont généralement plus puissants que la méthode de comparaisons multiples ou la méthode de Levene.