Comparaisons multiples de Kruskal-Wallis

La statistique H de Kruskal Willis est une statistique de test globale qui permet de tester l'hypothèse générale selon laquelle les médianes de toutes les populations sont égales. Souvent, la personne réalisant les recherches n'est pas tant intéressée par cette hypothèse générale que par les comparaisons au sein des groupes individuels. Cette macro réalise des comparaisons multiples de façon non paramétrique.

Télécharger la macro

Assurez-vous que Minitab connaît l'emplacement de la macro que vous avez téléchargée. Sélectionnez Outils > Options > Général. Sous Emplacement de la macro, accédez à l'emplacement où vous avez enregistré les fichiers de macro.

Important

Si vous utilisez un ancien navigateur Web, lorsque vous cliquez sur le bouton Télécharger, il est possible que le fichier s'ouvre dans Quicktime, qui partage l'extension de fichier .mac avec les macros de Minitab. Pour enregistrer la macro, cliquez avec le bouton droit de la souris sur le bouton Télécharger, puis sélectionnez Enregistrer la cible sous.

Entrées requises

  • Une colonne de données de réponses numériques
  • Une colonne correspondante de niveaux de facteur
Remarque

Vous pouvez utiliser des données désempilées en spécifiant la sous-commande UNSTACKED.

Entrées facultatives

UNSTACKED
Permet d'indiquer si les données sont désempilées.
FALPHA
Permet de spécifier le niveau d'alpha famille (la valeur par défaut est 0,20).
CONTROL C
Permet de définir la colonne (C) comme colonne de contrôle.
Remarque

Si les données sont empilées, la réponse du groupe de contrôle ne doit pas se situer dans la même colonne que la réponse des autres niveaux de facteur. La réponse du groupe de contrôle doit se situer dans une colonne à part.

Exécution de la macro

Supposons que les données de réponse se trouvent en C1 et les niveaux de facteur en C2. Pour exécuter la macro, sélectionnez Edition > Editeur de ligne de commande et saisissez :

%KRUSMC C1 C2

Cliquez sur Soumettre les commandes.

Résultats

La première partie des résultats de la fenêtre Session affichera le nombre de comparaisons (k) réalisées,

, l'alpha famille (α), l'alpha individuel de Bonferroni (β), et la valeur critique de Z bilatérale.

La section suivante illustre les différences normalisées entre les rangs moyens de groupes (θ) et les valeurs de p associées à ces différences. Remarquez que ces tableaux sont symétriques, il y a donc des astérisques dans la partie triangulaire supérieure du tableau. On trouve également des valeurs nulles le long de la diagonale du tableau car celle-ci représente une comparaison entre un groupe et lui-même (ces comparaisons sont inutiles et ne sont pas prises en compte dans l'analyse). Voici un exemple sur la façon de lire ce tableau : quelle est la différence entre les groupes 2 et 4 ? La troisième section affiche les intervalles de confiance pour le test du signe des médianes. Les niveaux de confiance de ces intervalles sont déterminés par votre alpha famille. Cette valeur étant globale, nous pouvons comparer les intervalles deux à deux (Annexe 2). Il est important de garder à l'esprit que le niveau de confiance désiré peut ne pas être atteint pour une partie ou la totalité des intervalles. De plus, cette couverture "globale" par l'alpha famille n'est pas exacte lorsque les effectifs d'échantillons sont différents, mais constitue souvent une approximation raisonnable.

La section finale montre les différences "significatives" (si tant est qu'il y en ait). Dans cette section, je présente la valeur de Z, la valeur critique de Z et la valeur de p associée à la valeur de Z.

Le graphique représente les différences normalisées non absolues entre les rangs moyens de groupes. Ce graphique est également extrêmement utile car il nous permet non seulement d'observer la magnitude des différences entre les groupes, mais également leur sens. Il représente également les valeurs critiques de Z positives et négatives, afin que vous sachiez si une différence est "significative".

Valeurs ex aequo au sein des données

S'il existe des valeurs ex aequo au sein des données, une constante de correction de biais (ou facteur de correction) de 2 est calculée. La statistique H est ensuite ajustée à 3. L'écart type (ξ) est aussi ajusté par le facteur de correction 4. Les résultats de la fenêtre Session donneront les tableaux ajustés et non ajustés. Toutefois, je fournirai uniquement les valeurs de p pour les tableaux ajustés car ce sont ceux-là qui doivent être utilisés. L'affichage des tableaux non ajustés vise principalement à montrer les effets des valeurs ex aequo sur les valeurs de Z. Si ces valeurs ex aequo sont particulièrement importantes, la validité des données doit être remise en question car ces tests partent de l'hypothèse selon laquelle les distributions sont continues. L'influence de ces valeurs ex aequo sur vos conclusions sera souvent faible ou nulle.

Remerciements

Merci au Docteur Tom Hettmansperger (Université d'Etat de Pennsylvanie) pour sa vérification de la macro, pour nos nombreuses discussions sur ce travail, ainsi que pour le temps qu'il nous a consacré et pour toute sa patience. Merci également à MM. Nicolas Bolgiano et Mike Delozier (Minitab, Inc.) pour leur suggestions et leurs critiques au sujet de cette macro.

Informations supplémentaires

Test de Dunn

Dunn (1964) a introduit une méthode efficace pour effectuer des inférences simultanées deux à deux. Elle consiste dans un premier temps à combiner les données, à les classer, à déterminer les rangs moyens des groupes, puis à mesurer les différences absolues normalisées entre ces rangs moyens.

Soit k = le nombre de traitements,

Soit = la somme des rangs pour le ième traitement, i = 1,…,k

Soit

= le nombre d'observations pour le ième traitement

Soit

Où j=l,...,k et j i

Statistique H

Nous conclurons ensuite à une "signification" si :

Où α est une valeur d'alpha famille spécifiée,

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique