Considérations relatives aux données pour Test de Kruskal-Wallis

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

Remarque

Lorsque vous utilisez une analyse paramétrique comme alternative au test de Kruskal-Wallis, vous devez vérifier que vos données présentent les caractéristiques requises pour cette analyse. Les caractéristiques requises pour les analyses paramétriques ne sont pas toujours compatibles avec celles des analyses non paramétriques, comme le test de Kruskal-Wallis.

Les données doivent inclure une seule variable de catégorie devant être un facteur fixe

Pour plus d'informations sur les facteurs, consultez les rubriques Facteurs et niveaux de facteurs et Facteurs fixes et aléatoires.

La variable de réponse doit être continue
Si la variable de réponse est une variable de catégorie, le modèle est moins susceptible de satisfaire les hypothèses de l'analyse, de décrire précisément vos données ou de permettre des prévisions utiles.
  • Si la variable de réponse contient deux catégories, comme Réussite et Echec, utilisez la fonction Ajuster le modèle logistique binaire.
  • Si la variable de réponse contient au moins trois catégories dont l'ordre est naturel, par exemple Absolument pas d'accord, Pas d'accord, Sans opinion, D'accord et Tout à fait d'accord, utilisez la fonction Régression logistique ordinale.
  • Si la variable de réponse contient au moins trois catégories qui n'ont pas d'ordre naturel, par exemple Eraflure, Entaille et Déchirure, utilisez la fonction Régression logistique nominale.
  • Si la variable de réponse dénombre des occurrences, comme le nombre de défauts, utilisez la fonction Ajuster le modèle de Poisson.
Il n'est pas nécessaire que les données échantillons soit distribuées normalement
Les lois de distribution des groupes doivent avoir la même forme et la même dispersion, et ne doivent comporter aucune valeur aberrante.
L'effectif d'échantillon doit être inférieur à 15 ou 20 observations, sinon votre procédé serait mieux représenté par la médiane

Les tests non paramétriques tendent à être moins puissants que les tests paramétriques. De plus, les tests paramétriques fonctionnent bien avec des données non normales tant que l'effectif d'échantillon est suffisamment élevé. Privilégiez plutôt les tests paramétriques même avec des données non normales, sauf si votre effectif d'échantillon est très réduit ou si la médiane est plus utile pour votre étude.

Si vos données respectent les indications suivantes concernant les effectifs d'échantillons, pensez éventuellement à utiliser ANOVA à un facteur contrôlé, qui obtient de très bons résultats avec les lois non normales et asymétriques, et offre plus de puissance.
  • Les données contiennent entre 2 et 9 groupes, et l'effectif d'échantillon de chaque groupe est d'au moins 15.
  • Les données contiennent entre 10 et 12 groupes, et l'effectif d'échantillon de chaque groupe est d'au moins 20.
L'effectif d'échantillon de chaque groupe doit être d'au moins 5.
Si un échantillon possède moins de cinq observations, la valeur de p peut être inexacte.
Chaque observation doit être indépendante de toutes les autres
Si vos observations ne sont pas indépendantes, les résultats ne seront peut-être pas valides. Tenez compte des points suivants pour déterminer si vos observations sont indépendantes :
  • Si une observation ne fournit aucune information sur la valeur d'une autre observation, cela signifie que les observations sont indépendantes.
  • Si une observation fournit des informations sur la valeur d'une autre observation, cela signifie que les observations sont dépendantes.

En présence d'observations dépendantes, reportez-vous à la rubrique Analyse d'un plan à mesures répétées. Pour plus d'informations sur les échantillons, reportez-vous à la rubrique Quelle est la différence entre des échantillons dépendants et indépendants ?.

Suivre les meilleures pratiques pour la collecte des données
Pour garantir la validité de vos résultats, suivez les indications ci-après :
  • Assurez-vous que les données sont représentatives de la population qui vous intéresse.
  • Collectez suffisamment de données pour bénéficier de la précision nécessaire.
  • Mesurez les variables de façon aussi exacte et précise que possible.
  • Enregistrez les données dans leur ordre de collecte.