Interprétation de toutes les statistiques et de tous les graphiques pour la fonction Test t à 2 échantillons

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique et chaque graphique fournis avec l'analyse du test t à 2 échantillons.

N

L'effectif de l'échantillon (N) est le nombre d'observations total de l'échantillon.

Interprétation

L'effectif de l'échantillon a une influence sur l'intervalle de confiance et la puissance du test.

En général, plus l'échantillon est grand, plus l'intervalle de confiance est étroit. En outre, un effectif d'échantillon plus grand donne au test plus de puissance pour détecter une différence. Pour plus d'informations, reportez-vous à la rubrique Qu'est-ce que la puissance ?.

Moyenne

La moyenne résume les valeurs d'échantillons en une seule valeur représentant le centre des données. Elle est calculée comme la moyenne des données, c'est-à-dire la somme de toutes les observations, divisée par le nombre d'observations.

Interprétation

La moyenne de chaque échantillon est une estimation de la moyenne de population de chaque échantillon.

EcTyp

L'écart type est la mesure la plus courante de la dispersion ou de la répartition des données sur la moyenne. Le symbole σ (sigma) est souvent utilisé pour représenter l'écart type d'une population, tandis que s sert à représenter l'écart type d'un échantillon. Une variation qui est aléatoire ou naturelle pour un procédé est souvent appelée un bruit.

L'écart type utilise les mêmes unités que les données.

Interprétation

Utilisez l'écart type pour déterminer la dispersion des données par rapport à la moyenne. Une valeur d'écart type élevée indique que les données sont dispersées. D'une manière générale, pour une loi normale, environ 68 % des valeurs se situent dans un écart type de la moyenne, 95 % des valeurs se situent dans deux écarts types et 99,7 % des valeurs se situent dans trois écarts types.

L'écart type de chaque échantillon est une estimation de chaque écart type de population. Les écarts types sont utilisés pour calculer l'intervalle de confiance et la valeur de p. Plus la valeur est élevée, moins les intervalles de confiance sont précis (ils sont plus étendus) et moins les tests sont puissants.

L'écart type peut également servir à établir une référence pour estimer la variation globale d'un procédé.
Hôpital 1
Hôpital 2
Durée jusqu'à la sortie de l'hôpital

Les administrateurs de deux hôpitaux étudient le temps que passent les patients dans le service des urgences de leurs établissements jusqu'à leur sortie. Bien que ces durées moyennes soient pratiquement identiques (35 minutes), les écarts types diffèrent de manière significative. L'écart type pour l'hôpital 1 est d'environ 6. En moyenne, la durée qui s'écoule jusqu'à la sortie d'un patient présente un écart d'environ 6 minutes par rapport à la moyenne (ligne bleue). L'écart type pour l'hôpital 2 est d'environ 20. En moyenne, la durée qui s'écoule jusqu'à la sortie d'un patient présente un écart d'environ 20 minutes par rapport à la moyenne (ligne bleue).

ErT moyenne

L'erreur type de la moyenne (ErT moyenne) estime la variabilité entre les moyennes d'échantillons que vous obtiendriez si vous preniez des échantillons répétés de la même population. Elle évalue la variabilité d'un échantillon à un autre, tandis que l'écart type mesure la variabilité au sein d'un même échantillon.

Par exemple, vous disposez d'un délai de livraison moyen de 3,80 jours avec un écart type de 1,43 jour, basé sur un échantillon aléatoire de 312 délais de livraison. Ces chiffres génèrent une erreur type de la moyenne de 0,08 jour (1,43 divisé par la racine carrée de 312). Si vous prenez en compte plusieurs échantillons aléatoires de même effectif et provenant de la même population, l'écart type de ces différentes moyennes d'échantillons tournerait autour de 0,08 jour.

Interprétation

Vous pouvez utiliser l'erreur type de la moyenne pour déterminer avec quelle précision la moyenne de l'échantillon évalue la moyenne de la population.

Lorsque la valeur de l'erreur type de la moyenne est moins élevée, l'estimation de la moyenne de la population est plus précise. En règle générale, plus l'écart type est grand, plus l'erreur type de la moyenne est élevée et moins l'estimation de la moyenne de la population est précise. En revanche, plus l'effectif d'échantillon est élevé, plus l'erreur type de la moyenne est faible et plus l'estimation de la moyenne de la population est précise.

Minitab utilise l'erreur type de la moyenne pour calculer l'intervalle de confiance.

Différence : μ1μ2

La différence est la différence inconnue entre les moyennes de la population que vous souhaitez estimer. Minitab indique quelle moyenne de la population est soustraite à l'autre.

Estimation de la différence

La différence est la différence entre les moyennes des deux échantillons.

La différence étant calculée à partir des données d'échantillon et non de l'ensemble de la population, il est peu probable que la différence de l'échantillon soit égale à celle de la population. Pour mieux estimer la différence de la population, utilisez l'intervalle de confiance.

Bornes et intervalle de confiance (IC)

L'intervalle de confiance fournit une étendue de valeurs probables pour la différence de la population. Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Toutefois, si vous répétiez l'échantillonnage de nombreuses fois, un certain pourcentage des intervalles de confiance ou bornes obtenus contiendrait la différence de population inconnue. Le pourcentage de ces intervalles de confiance ou bornes contenant la différence est le niveau de confiance de l'intervalle. Par exemple, un niveau de confiance de 95 % indique que, sur 100 échantillons pris de façon aléatoire parmi la population, environ 95 de ces échantillons devraient produire des intervalles contenant la différence de population.

Une borne supérieure définit une valeur à laquelle la différence de la population est susceptible d'être inférieure. Une borne inférieure définit une valeur à laquelle la différence de la population est susceptible d'être supérieure.

L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon. Pour plus d'informations, reportez-vous à la rubrique Obtenir un intervalle de confiance plus précis.

Estimation de la différence

DifférenceIC à 95% pour la
différence
21,00(14,22; 27,78)

Dans ces résultats, l'estimation de la différence des moyennes de la population en matière d'évaluations d'hôpitaux est de 21. Vous pouvez être sûr à 95 % que la moyenne de la population pour la différence est comprise entre 14,22 et 27,78.

Hypothèse nulle et hypothèse alternative

Le test t de la différence affiche les hypothèses nulle et alternative. Les hypothèses nulle et alternative sont deux déclarations s'excluant mutuellement sur une population. Un test d'hypothèse utilise des données échantillons pour déterminer si l'hypothèse nulle peut être rejetée.
Hypothèse nulle
L'hypothèse nulle affirme qu'un paramètre de la population (la moyenne, l'écart type, etc.) est égal à une valeur hypothétisée. L'hypothèse nulle est souvent une déclaration initiale basée sur des analyses précédentes ou des connaissances spécialisées.
Hypothèse alternative
L'hypothèse alternative affirme qu'un paramètre de la population est plus petit, plus grand ou différent de la valeur hypothétisée dans l'hypothèse nulle. L'hypothèse alternative est celle que vous pensez être vraie ou que vous espérez démontrer.

Dans les résultats, les hypothèses nulle et alternative vous permettent de vérifier que vous avez saisi une valeur correcte pour le test de la différence.

Valeur de T

La valeur de t est la valeur observée de la statistique de test t qui mesure la différence entre une statistique d'échantillon observée et son paramètre de population hypothétisé, en unités d'erreur type.

Interprétation

Vous pouvez comparer la valeur de p aux valeurs critiques de la loi de distribution t pour déterminer s'il faut rejeter l'hypothèse nulle. Cependant, il est souvent plus pratique et plus commode d'utiliser la valeur de p du test pour cela.

Pour savoir si l'hypothèse nulle doit être rejetée, comparez la valeur de t à la valeur critique. Lorsque vous supposez que des variances sont égales, la valeur critique est tα/2, n+m–2 pour un test bilatéral et tα, n+m–2 pour un test unilatéral. Lorsque vous ne pouvez pas supposer que des variances sont égales, la valeur critique est tα/2, r pour un test bilatéral et tα, r pour un test unilatéral, où r représente les degrés de liberté. Pour un test bilatéral, si la valeur absolue de t est supérieure à la valeur critique, vous rejetez l'hypothèse nulle. Dans le cas contraire, vous ne pouvez pas rejeter l'hypothèse nulle. Vous pouvez calculer la valeur critique dans Minitab ou la rechercher dans un tableau de loi T, disponible dans la plupart des livres de statistiques. Pour plus d'informations, accédez à la rubrique Utilisation de la fonction de répartition (CDF) inverse et cliquez sur "Utiliser la CDF inverse pour calculer des valeurs critiques".

La valeur de t sert à calculer la valeur de p.

Valeur de p

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Une valeur de p inférieure fournit des preuves plus solides par rapport à l'hypothèse nulle.

Interprétation

Utilisez la valeur de p pour déterminer si la différence entre des moyennes de population est statistiquement significative.

Pour déterminer si la différence entre les moyennes de population est statistiquement significative, comparez la valeur de p au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'une différence existe.
Valeur de p ≤ α : la différence entre les moyennes est statistiquement significative (Rejeter H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez rejeter l'hypothèse nulle. Vous pouvez conclure que la différence entre les moyennes de population n'est pas égale à la différence hypothétisée. Si vous n'avez pas spécifié de différence hypothétisée, Minitab vérifie l'absence de différence entre les moyennes (Différence hypothétisée = 0). Utilisez vos connaissances afin de déterminer si la différence est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Signification statistique et pratique.
Valeur de p > α : la différence entre les moyennes n'est pas statistiquement significative (Impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous n'êtes pas en mesure de conclure que la différence entre les moyennes de population est statistiquement significative. Vous devez vous assurer que votre test est assez puissant pour détecter une différence qui est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Puissance et effectif de l'échantillon pour un test t à 2 échantillons.

DL

Les degrés de libertés (DL) représentent la quantité d'informations disponibles dans les données pour estimer les valeurs des paramètres inconnus et calculer la variabilité de ces estimations. Pour un test t à 2 échantillons, les degrés de liberté se déterminent d'après le nombre d'observations de votre échantillon et dépendent également de l'hypothèse d'égalité des variances.

Interprétation

Minitab utilise les degrés de liberté pour déterminer la statistique du test. Les degrés de liberté sont déterminés par l'effectif de l'échantillon. L'accroissement de l'effectif de l'échantillon permet d'obtenir davantage d'informations sur la population, ce qui augmente les degrés de liberté.

Ecart type de regroupement

L'écart type groupé est une estimation de l'écart type commun pour les deux échantillons. L'écart type groupé est l'écart type de tous les points de données autour de leur moyenne de groupe (pas autour de la moyenne globale). L'influence des groupes sur l'estimation globale des écarts types groupés est proportionnelle à leur taille.

Interprétation

L'écart type sert à calculer l'intervalle de confiance et la valeur de p.

Une valeur d'écart type élevée indique que les données sont dispersées. Plus la valeur est élevée, moins les intervalles de confiance sont précis (ils sont plus étendus) et moins les tests sont puissants.

Exemple d'écart type regroupé

Supposons que votre étude analyse les deux groupes suivants :
Groupe Moyenne Ecart type N
1 9,7 2,5 50
2 17,3 6,8 200

Le premier groupe (n=50) a un écart type de 2,5. Le deuxième groupe est plus gros (n=200) et a un écart type plus important (6,8). Etant donné que l'écart type groupé utilise une moyenne pondérée, sa valeur est plus proche de l'écart type du plus grand groupe. Si vous utilisiez une simple moyenne, les deux groupes auraient eu un effet égal.

Diagramme des valeurs individuelles

Un diagramme des valeurs individuelles présente les valeurs individuelles contenues dans chaque échantillon. Il facilite la comparaison des échantillons. Chaque cercle représente une observation. Un diagramme des valeurs individuelles est particulièrement utile lorsque vous disposez de relativement peu d'observations et que vous avez besoin d'évaluer l'effet de chacune d'entre elles.

Interprétation

Utilisez un diagramme des valeurs individuelles pour examiner la dispersion des données et pour détecter d'éventuelles valeurs aberrantes. Les diagrammes des valeurs individuelles sont plus adaptés lorsque l'effectif d'échantillon est inférieur à 50.

Données asymétriques

Examinez de la dispersion des données pour déterminer si elles semblent asymétriques. Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Asymétrie à droite
Asymétrie à gauche

Le diagramme des valeurs individuelles avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. Le diagramme des valeurs individuelles avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Les données qui sont très asymétriques peuvent avoir une incidence sur la validité de la valeur de p si vos échantillons sont petits (l'un des échantillons contient moins de 15 valeurs). Si vos données sont très asymétriques et que vous avez un petit échantillon, pensez éventuellement à augmenter l'effectif d'échantillon.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur les résultats de votre analyse. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur un diagramme des valeurs individuelles, les valeurs de données anormalement élevées ou faibles indiquent de possibles valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Supprimez éventuellement les valeurs de données associées à des événements anormaux et uniques (aussi appelés causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Identification des valeurs aberrantes.

Boîte à moustaches

Une boîte a moustaches fournit un récapitulatif graphique de la loi de distribution de chaque échantillon. Elle facilite la comparaison de la forme, de la tendance centrale et de la variabilité des échantillons.

Interprétation

Utilisez une boîte à moustaches pour examiner la dispersion des données et pour détecter d'éventuelles valeurs aberrantes. Les boîtes à moustaches sont plus adaptées lorsque l'effectif d'échantillon est supérieur à 20.

Données asymétriques

Examinez de la dispersion des données pour déterminer si elles semblent asymétriques. Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Asymétrie à droite
Asymétrie à gauche

La boîte à moustaches avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. La boîte à moustaches avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Les données qui sont très asymétriques peuvent avoir une incidence sur la validité de la valeur de p si vos échantillons sont petits (l'un des échantillons contient moins de 15 valeurs). Si vos données sont très asymétriques et que vous avez un petit échantillon, pensez éventuellement à augmenter l'effectif d'échantillon.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur les résultats de votre analyse. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur une boîte à moustaches, les astérisques (*) indiquent les valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Supprimez éventuellement les valeurs de données associées à des événements anormaux et uniques (aussi appelés causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Identification des valeurs aberrantes.