Interprétation de toutes les statistiques et de tous les graphiques pour la fonction Test t pour données appariées

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique et chaque graphique fournis avec l'analyse du test t pour données appariées.

N

L'effectif de l'échantillon (N) est le nombre d'observations total de l'échantillon.

Interprétation

L'effectif de l'échantillon a une influence sur l'intervalle de confiance et la puissance du test.

En général, plus l'échantillon est grand, plus l'intervalle de confiance est étroit. En outre, un effectif d'échantillon plus grand donne au test plus de puissance pour détecter une différence. Pour plus d'informations, reportez-vous à la rubrique Qu'est-ce que la puissance ?.

Moyenne

Minitab affiche la moyenne pour chaque échantillon et la moyenne des différences entre les observations appariées.

La moyenne résume les valeurs d'échantillons en une seule valeur représentant le centre des données. Elle est calculée comme la moyenne des données, c'est-à-dire la somme de toutes les observations, divisée par le nombre d'observations.

Pour calculer la différence moyenne, Minitab calcule les différences entre les observations appariées, puis calcule la moyenne des différences.

Interprétation

La différence moyenne est une estimation de la différence moyenne de la population.

La différence moyenne étant calculée à partir des données d'échantillon et non de l'ensemble de la population, il est peu probable que la différence moyenne de l'échantillon soit égale à celle de la population. Pour mieux estimer la différence moyenne de la population, utilisez l'intervalle de confiance de la différence.

EcTyp

L'écart type est la mesure la plus courante de la dispersion ou de la répartition des données sur la moyenne. Le symbole σ (sigma) est souvent utilisé pour représenter l'écart type d'une population, tandis que s sert à représenter l'écart type d'un échantillon. Une variation qui est aléatoire ou naturelle pour un procédé est souvent appelée un bruit.

L'écart type utilise les mêmes unités que les données.

Interprétation

Utilisez l'écart type pour déterminer la dispersion des données par rapport à la moyenne. Une valeur d'écart type élevée indique que les données sont dispersées. D'une manière générale, pour une loi normale, environ 68 % des valeurs se situent dans un écart type de la moyenne, 95 % des valeurs se situent dans deux écarts types et 99,7 % des valeurs se situent dans trois écarts types.

L'écart type des données échantillons est une estimation de l'écart type de la population. L'écart type est utilisé pour calculer l'intervalle de confiance et la valeur de p. Plus la valeur est élevée, moins les intervalles de confiance sont précis (ils sont plus étendus) et moins les tests sont puissants.

L'écart type peut également servir à établir une référence pour estimer la variation globale d'un procédé.
Hôpital 1
Hôpital 2
Durée jusqu'à la sortie de l'hôpital

Les administrateurs de deux hôpitaux étudient le temps que passent les patients dans le service des urgences de leurs établissements jusqu'à leur sortie. Bien que ces durées moyennes soient pratiquement identiques (35 minutes), les écarts types diffèrent de manière significative. L'écart type pour l'hôpital 1 est d'environ 6. En moyenne, la durée qui s'écoule jusqu'à la sortie d'un patient présente un écart d'environ 6 minutes par rapport à la moyenne (ligne bleue). L'écart type pour l'hôpital 2 est d'environ 20. En moyenne, la durée qui s'écoule jusqu'à la sortie d'un patient présente un écart d'environ 20 minutes par rapport à la moyenne (ligne bleue).

ErT moyenne

L'erreur type de la moyenne (ErT moyenne) estime la variabilité entre les moyennes d'échantillons que vous obtiendriez si vous preniez des échantillons répétés de la même population. Elle évalue la variabilité d'un échantillon à un autre, tandis que l'écart type mesure la variabilité au sein d'un même échantillon.

Par exemple, vous disposez d'un délai de livraison moyen de 3,80 jours avec un écart type de 1,43 jour, basé sur un échantillon aléatoire de 312 délais de livraison. Ces chiffres génèrent une erreur type de la moyenne de 0,08 jour (1,43 divisé par la racine carrée de 312). Si vous prenez en compte plusieurs échantillons aléatoires de même effectif et provenant de la même population, l'écart type de ces différentes moyennes d'échantillons tournerait autour de 0,08 jour.

Interprétation

Vous pouvez utiliser l'erreur type de la moyenne pour déterminer avec quelle précision la moyenne de l'échantillon évalue la moyenne de la population.

Lorsque la valeur de l'erreur type de la moyenne est moins élevée, l'estimation de la moyenne de la population est plus précise. En règle générale, plus l'écart type est grand, plus l'erreur type de la moyenne est élevée et moins l'estimation de la moyenne de la population est précise. En revanche, plus l'effectif d'échantillon est élevé, plus l'erreur type de la moyenne est faible et plus l'estimation de la moyenne de la population est précise.

Minitab utilise l'erreur type de la moyenne pour calculer l'intervalle de confiance.

Bornes et intervalle de confiance (IC)

L'intervalle de confiance fournit une étendue de valeurs probables pour la différence moyenne de la population. Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Toutefois, si vous répétiez l'échantillonnage de nombreuses fois, un certain pourcentage des intervalles de confiance ou bornes obtenus contiendrait la différence moyenne de population inconnue. Le pourcentage de ces intervalles de confiance ou bornes contenant la différence moyenne est le niveau de confiance de l'intervalle. Par exemple, un niveau de confiance de 95 % indique que, sur 100 échantillons pris de façon aléatoire parmi la population, environ 95 de ces échantillons devraient produire des intervalles contenant la différence moyenne de population.

Une borne supérieure définit une valeur à laquelle la différence moyenne de population est susceptible d'être inférieure. Une borne inférieure définit une valeur à laquelle la différence moyenne de population est susceptible d'être supérieure.

L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon. Pour plus d'informations, reportez-vous à la rubrique Obtenir un intervalle de confiance plus précis.

Estimation de la différence pour données appariées

MoyenneEcTypErT moyenneIC à 95% pour
μ_différence
2,2003,2540,728(0,677; 3,723)
µ_différence : moyenne de population de (Avant - Après)

Dans ces résultats, l'estimation de la différence moyenne de la population en matière de fréquence cardiaque est de 2,2. Vous pouvez être sûr à 95 % que la différence moyenne de la population est comprise entre 0,677 et 3,723.

Hypothèse nulle et hypothèse alternative

Les hypothèses nulle et alternative sont deux déclarations s'excluant mutuellement sur une population. Un test d'hypothèse utilise des données échantillons pour déterminer si l'hypothèse nulle peut être rejetée.
Hypothèse nulle
L'hypothèse nulle affirme qu'un paramètre de la population (la moyenne, l'écart type, etc.) est égal à une valeur hypothétisée. L'hypothèse nulle est souvent une déclaration initiale basée sur des analyses précédentes ou des connaissances spécialisées.
Hypothèse alternative
L'hypothèse alternative affirme qu'un paramètre de la population est plus petit, plus grand ou différent de la valeur hypothétisée dans l'hypothèse nulle. L'hypothèse alternative est celle que vous pensez être vraie ou que vous espérez démontrer.

Dans les résultats, les hypothèses nulle et alternative vous permettent de vérifier que vous avez saisi une valeur correcte pour le test de la différence.

Valeur de T

La valeur de t est la valeur observée de la statistique de test t qui mesure la différence entre une statistique d'échantillon observée et son paramètre de population hypothétisé, en unités d'erreur type.

Interprétation

Vous pouvez comparer la valeur de p aux valeurs critiques de la loi de distribution t pour déterminer s'il faut rejeter l'hypothèse nulle. Cependant, il est souvent plus pratique et plus commode d'utiliser la valeur de p du test pour cela.

Pour savoir si l'hypothèse nulle doit être rejetée, comparez la valeur de t à la valeur critique. La valeur critique est tα/2, n–1 pour un test bilatéral et tα, n–1 pour un test unilatéral. Pour un test bilatéral, si la valeur absolue de t est supérieure à la valeur critique, vous rejetez l'hypothèse nulle. Dans le cas contraire, vous ne pouvez pas rejeter l'hypothèse nulle. Vous pouvez calculer la valeur critique dans Minitab ou la rechercher dans un tableau de loi T, disponible dans la plupart des livres de statistiques. Pour plus d'informations, accédez à la rubrique Utilisation de la fonction de répartition (CDF) inverse et cliquez sur "Utiliser la CDF inverse pour calculer des valeurs critiques".

La valeur de t sert à calculer la valeur de p.

valeur de p

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Une valeur de p inférieure fournit des preuves plus solides par rapport à l'hypothèse nulle.

Interprétation

Utilisez la valeur de p pour déterminer si la moyenne des différences de population est statistiquement différente de la moyenne des différences hypothétisée.

Pour déterminer si la différence entre les moyennes de population est statistiquement significative, comparez la valeur de p au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'une différence existe.
Valeur de p ≤ α : la différence entre les moyennes est statistiquement significative (Rejeter H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez rejeter l'hypothèse nulle. Vous pouvez conclure que la différence entre les moyennes de population n'est pas égale à la différence hypothétisée. Si vous n'avez pas indiqué de différence hypothétisée, Minitab teste l'absence de différence entre les moyennes (Différence hypothétisée = 0) Utilisez vos connaissances afin de déterminer si la différence est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Signification statistique et pratique.
Valeur de p > α : la différence entre les moyennes n'est pas statistiquement significative (Impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous n'êtes pas en mesure de conclure que la différence des moyennes des observations appariées est statistiquement significative. Vous devez vous assurer que votre test est assez puissant pour détecter une différence qui est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Puissance et effectif de l'échantillon pour un test t pour données appariées.

Histogramme

Un histogramme divise les valeurs des échantillons en plusieurs intervalles et représente l'effectif des valeurs contenues dans chaque intervalle par une barre.

Interprétation

Utilisez un histogramme pour évaluer la forme et la dispersion des données. Les histogrammes sont plus adaptés lorsque l'effectif d'échantillon est supérieur à 20.

Données asymétriques

Examinez de la dispersion des données pour déterminer si elles semblent asymétriques. Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Asymétrie à droite
Asymétrie à gauche

L'histogramme avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. L'histogramme avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Les données qui sont très asymétriques peuvent avoir une incidence sur la validité de la valeur de p si votre échantillon est petit (moins de 20 valeurs). Si vos données sont très asymétriques et que vous avez un petit échantillon, pensez éventuellement à augmenter l'effectif d'échantillon.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur les résultats de votre analyse. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur un histogramme, des barres isolées à une extrémité ou l'autre du graphique indiquent de possibles valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Supprimez éventuellement les valeurs de données associées à des événements anormaux et uniques (aussi appelés causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Identification des valeurs aberrantes.

Diagramme des valeurs individuelles

Un diagramme des valeurs individuelles présente les valeurs individuelles contenues dans l'échantillon. Chaque cercle représente une observation. Un diagramme des valeurs individuelles est particulièrement utile lorsque vous disposez de relativement peu d'observations et que vous avez besoin d'évaluer l'effet de chacune d'entre elles.

Interprétation

Utilisez un diagramme des valeurs individuelles pour examiner la dispersion des données et pour détecter d'éventuelles valeurs aberrantes. Les diagrammes des valeurs individuelles sont plus adaptés lorsque l'effectif d'échantillon est inférieur à 50.

Données asymétriques

Examinez de la dispersion des données pour déterminer si elles semblent asymétriques. Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Asymétrie à droite
Asymétrie à gauche

Le diagramme des valeurs individuelles avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. Le diagramme des valeurs individuelles avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Les données qui sont très asymétriques peuvent avoir une incidence sur la validité de la valeur de p si votre échantillon est petit (moins de 20 valeurs). Si vos données sont très asymétriques et que vous avez un petit échantillon, pensez éventuellement à augmenter l'effectif d'échantillon.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur les résultats de votre analyse. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur un diagramme des valeurs individuelles, les valeurs de données anormalement élevées ou faibles indiquent de possibles valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Supprimez éventuellement les valeurs de données associées à des événements anormaux et uniques (aussi appelés causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Identification des valeurs aberrantes.

Boîte à moustaches

Une boîte à moustaches fournit un récapitulatif graphique de la loi de distribution d'un échantillon. La boîte à moustaches indique la forme, la tendance centrale et la variabilité des données.

Interprétation

Utilisez une boîte à moustaches pour examiner la dispersion des données et pour détecter d'éventuelles valeurs aberrantes. Les boîtes à moustaches sont plus adaptées lorsque l'effectif d'échantillon est supérieur à 20.

Données asymétriques

Examinez de la dispersion des données pour déterminer si elles semblent asymétriques. Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Asymétrie à droite
Asymétrie à gauche

La boîte à moustaches avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. La boîte à moustaches avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Les données qui sont très asymétriques peuvent avoir une incidence sur la validité de la valeur de p si votre échantillon est petit (moins de 20 valeurs). Si vos données sont très asymétriques et que vous avez un petit échantillon, pensez éventuellement à augmenter l'effectif d'échantillon.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur les résultats de votre analyse. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur une boîte à moustaches, les astérisques (*) indiquent les valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Supprimez éventuellement les valeurs de données associées à des événements anormaux et uniques (aussi appelés causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Identification des valeurs aberrantes.