Interprétation de toutes les statistiques pour la fonction Test de Mann-Whitney

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie avec l'analyse de Mann-Whitney.

Sur ce thème

N
Médiane
Différence
Intervalle de confiance (IC pour la différence) et bornes de confiance
Hypothèse nulle et hypothèse alternative
Valeur W
Valeur de p

N

L'effectif de l'échantillon (N) est le nombre d'observations total de l'échantillon.

Interprétation

L'effectif de l'échantillon a une influence sur l'intervalle de confiance et la puissance du test.

En général, plus l'échantillon est grand, plus l'intervalle de confiance est étroit. En outre, un effectif d'échantillon plus grand donne au test plus de puissance pour détecter une différence. Pour plus d'informations, reportez-vous à la rubrique Qu'est-ce que la puissance ?.

Médiane

La médiane représente le milieu de l'ensemble de données. Ce point de milieu est celui qui sépare les observations en deux moitiés égales, l'une supérieure à la valeur, l'autre inférieure. La médiane est déterminée en classant les observations, puis en prenant l'observation de rang [N + 1] / 2 dans l'ordre obtenu. Si le nombre d'observations est pair, la médiane est égale à la moyenne des observations de rang N/2 et [N/2] + 1.

Interprétation

La médiane de chaque échantillon est une estimation de la médiane de la population de chaque échantillon.

Différence

La différence est la différence entre les médianes des deux échantillons.

La différence étant calculée à partir des données d'échantillon et non de l'ensemble de la population, il est peu probable que la différence de l'échantillon soit égale à celle de la population. Pour mieux estimer la différence de la population, utilisez l'intervalle de confiance.

Intervalle de confiance (IC pour la différence) et bornes de confiance

L'intervalle de confiance fournit une étendue de valeurs probables pour la différence de la population. Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Toutefois, si vous répétiez l'échantillonnage de nombreuses fois, un certain pourcentage des intervalles de confiance ou bornes obtenus contiendrait la différence de population inconnue. Le pourcentage de ces intervalles de confiance ou bornes contenant la différence est le niveau de confiance de l'intervalle. Par exemple, un niveau de confiance de 95 % indique que, sur 100 échantillons pris de façon aléatoire parmi la population, environ 95 de ces échantillons devraient produire des intervalles contenant la différence de population.

Une borne supérieure définit une valeur à laquelle la différence de la population est susceptible d'être inférieure. Une borne inférieure définit une valeur à laquelle la différence de la population est susceptible d'être supérieure.

L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon.

Estimation de la différence

Différence	IC pour la différence	Confiance atteinte
-1,85	(-3; -0,9)	95,52%

Dans ces résultats, l'estimation ponctuelle de la médiane de la population pour la différence du nombre de mois qu'une peinture tient sur deux autoroutes est de −1,85. Vous pouvez être sûr à 95,52 % que la différence entre les médianes de la population est comprise entre −3,0 et −0,9.

Hypothèse nulle et hypothèse alternative

Les hypothèses nulle et alternative sont deux déclarations s'excluant mutuellement sur une population. Un test d'hypothèse utilise des données échantillons pour déterminer si l'hypothèse nulle peut être rejetée.

Hypothèse nulle: L'hypothèse nulle affirme qu'un paramètre de la population (la moyenne, l'écart type, etc.) est égal à une valeur hypothétisée. L'hypothèse nulle est souvent une déclaration initiale basée sur des analyses précédentes ou des connaissances spécialisées.
Hypothèse alternative: L'hypothèse alternative affirme qu'un paramètre de la population est plus petit, plus grand ou différent de la valeur hypothétisée dans l'hypothèse nulle. L'hypothèse alternative est celle que vous pensez être vraie ou que vous espérez démontrer.

Valeur W

La statistique de Mann-Whitney (valeur W) est la somme des rangs du premier échantillon.

Minitab calcule la statistique de Mann-Whitney comme suit :

Minitab classe les valeurs combinées des deux échantillons dans l'ordre. Minitab attribue le rang 1 à la plus petite observation, le rang 2 à la deuxième plus petite observation, et ainsi de suite.
Si deux observations ou plus sont égales, Minitab leur attribue la moyenne de leurs rangs respectifs.
Minitab résume les rangs du premier échantillon.

Interprétation

Minitab utilise la statistique de Mann-Whitney pour calculer la valeur de p, qui est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle.

Etant donné que l'interprétation de la statistique de Mann-Whitney dépend de l'effectif de l'échantillon, utilisez plutôt la valeur de p pour prendre une décision concernant le test. La valeur de p a la même signification, quel que soit l'effectif de l'échantillon.

Valeur de p

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Une valeur de p inférieure fournit des preuves plus solides par rapport à l'hypothèse nulle.

Interprétation

Utilisez la valeur de p pour déterminer si la différence entre des médianes de population est statistiquement significative.

Pour déterminer si la différence entre les médianes est statistiquement significative, comparez la valeur de p au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'une différence existe.

Valeur de p ≤ α : la différence entre les médianes est statistiquement significative (Rejeter H₀): Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez rejeter l'hypothèse nulle. Vous pouvez conclure que la différence entre les médianes de population est statistiquement significative. Utilisez vos connaissances afin de déterminer si la différence est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Signification statistique et pratique.
Valeur de p > α : la différence entre les médianes n'est pas statistiquement significative (Impossible de rejeter H₀): Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous ne disposez pas des preuves suffisantes pour conclure que la différence entre les médianes de population est statistiquement significative. Vous devez vous assurer que votre test est assez puissant pour détecter une différence qui est significative dans la pratique.

On parle de valeur ex aequo lorsque la même valeur est présente dans plusieurs échantillons. Si vos données contiennent des nombres de même grandeur (valeurs ex aequo), Minitab affiche une valeur de p ajustée pour ces nombres et une autre valeur de p non ajustée. La valeur de p ajustée est généralement plus exacte que la valeur de p non ajustée. Cependant, dans la mesure où cette dernière est toujours supérieure à la valeur de p ajustée pour une paire d'échantillons donnée, la valeur de p non ajustée est l'estimation la plus prudente.