Interprétation de toutes les statistiques pour la fonction Test de Poisson à 2 échantillons

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie avec l'analyse de taux de Poisson à 2 échantillons.

Différence = taux 1 - taux 2

La différence est la différence inconnue entre les taux de la population que vous souhaitez estimer. Minitab indique quel taux de la population est soustrait à l'autre.

Durée d'observation

Les processus de Poisson comptent le nombre d'occurrences d'un événement ou d'une caractéristique sur une plage d'observation spécifique qui peut représenter des composantes telles que la durée, l'aire, le volume et des nombres d'éléments. La durée d'observation représente l'ampleur, la durée ou la taille de chaque plage d'observation.

Interprétation

Minitab utilise la durée d'observation pour exprimer la fréquence (taux) d'échantillon de la façon la mieux adaptée à votre situation.

Par exemple, si chaque observation d'un échantillon compte le nombre d'événements survenant dans une année, une longueur de 1 représente un taux d'occurrence annuel, alors qu'une longueur de 12 représente un taux d'occurrence mensuel.

Minitab utilise le nombre total d'occurrences, l'effectif de l'échantillon (N) et la durée d'observation pour calculer la fréquence (taux) d'échantillon. Par exemple, des inspecteurs vérifient le nombre de défauts dans des paquets de serviettes de 2 lignes d'assemblage (A et B). Chaque serviette peut présenter plusieurs défauts, comme 1 déchirure et 2 accrocs, soit 3 défauts. Pour la ligne d'assemblage A, chaque paquet contient 10 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 112 défauts. Pour la ligne d'assemblage B, chaque paquet contient 15 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 132 défauts.
  • Pour la ligne d'assemblage A, le nombre total d'occurrences est de 112, car les inspecteurs ont relevé 112 défauts. Pour la ligne d'assemblage B, le nombre total d'occurrences est de 132, car les inspecteurs ont relevé 132 défauts.
  • L'effectif de l'échantillon (N) est de 50 pour les deux lignes d'assemblage, car les inspecteurs ont constitué des échantillons de 50 paquets pour les deux lignes.
  • Pour déterminer le nombre de défauts par serviette, les inspecteurs utilisent une durée d'observation de 10 pour la ligne d'assemblage A, car un paquet contient 10 serviettes. Pour la ligne d'assemblage B, les inspecteurs utilisent une durée d'observation de 15.
  • Pour la ligne d'assemblage A, la fréquence (taux) d'échantillon est égale à : (nombre total d'occurrences / N) / (durée d'observation) = (112 / 50) / 10 = 0,224. Pour la ligne d'assemblage B, la fréquence (taux) d'échantillon est égale à : (132 / 50) / 15 = 0,176. Ainsi, chaque serviette comporte en moyenne 0,244 défaut pour la ligne d'assemblage A et 0,176 défaut pour la ligne d'assemblage B.
  • Comme les inspecteurs entrent une durée d'observation autre que 1, Minitab calcule également la moyenne d'échantillon. Pour la ligne d'assemblage A, la moyenne d'échantillon este égal à : (nombre total d'occurrences / N) = 112/50 = 2,24. Pour la ligne d'assemblage B, la moyenne d'échantillon est égale à : (132 / 50) = 2,64. La moyenne d'échantillon décrit le nombre moyen de défauts par paquet. Toutefois, comme les paquets ne contiennent pas tous le même nombre de serviettes, la fréquence (taux) d'échantillon est une statistique plus utile.

Nombre total d'occurrences

Le nombre total d'occurrences est le nombre d'occurrences d'un événement dans l'échantillon.

Minitab utilise le nombre total d'occurrences, l'effectif de l'échantillon (N) et la durée d'observation pour calculer la fréquence (taux) d'échantillon. Par exemple, des inspecteurs vérifient le nombre de défauts dans des paquets de serviettes de 2 lignes d'assemblage (A et B). Chaque serviette peut présenter plusieurs défauts, comme 1 déchirure et 2 accrocs, soit 3 défauts. Pour la ligne d'assemblage A, chaque paquet contient 10 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 112 défauts. Pour la ligne d'assemblage B, chaque paquet contient 15 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 132 défauts.
  • Pour la ligne d'assemblage A, le nombre total d'occurrences est de 112, car les inspecteurs ont relevé 112 défauts. Pour la ligne d'assemblage B, le nombre total d'occurrences est de 132, car les inspecteurs ont relevé 132 défauts.
  • L'effectif de l'échantillon (N) est de 50 pour les deux lignes d'assemblage, car les inspecteurs ont constitué des échantillons de 50 paquets pour les deux lignes.
  • Pour déterminer le nombre de défauts par serviette, les inspecteurs utilisent une durée d'observation de 10 pour la ligne d'assemblage A, car un paquet contient 10 serviettes. Pour la ligne d'assemblage B, les inspecteurs utilisent une durée d'observation de 15.
  • Pour la ligne d'assemblage A, la fréquence (taux) d'échantillon est égale à : (nombre total d'occurrences / N) / (durée d'observation) = (112 / 50) / 10 = 0,224. Pour la ligne d'assemblage B, la fréquence (taux) d'échantillon est égale à : (132 / 50) / 15 = 0,176. Ainsi, chaque serviette comporte en moyenne 0,244 défaut pour la ligne d'assemblage A et 0,176 défaut pour la ligne d'assemblage B.
  • Comme les inspecteurs entrent une durée d'observation autre que 1, Minitab calcule également la moyenne d'échantillon. Pour la ligne d'assemblage A, la moyenne d'échantillon este égal à : (nombre total d'occurrences / N) = 112/50 = 2,24. Pour la ligne d'assemblage B, la moyenne d'échantillon est égale à : (132 / 50) = 2,64. La moyenne d'échantillon décrit le nombre moyen de défauts par paquet. Toutefois, comme les paquets ne contiennent pas tous le même nombre de serviettes, la fréquence (taux) d'échantillon est une statistique plus utile.

N

L'effectif de l'échantillon (N) est le nombre d'observations total de l'échantilon.

Interprétation

L'effectif d'échantillon a une incidence sur l'intervalle de confiance, la puissance du test et le taux d'occurrence.

En général, plus l'échantillon est grand, plus l'intervalle de confiance est étroit. En outre, un effectif d'échantillon plus grand donne au test plus de puissance pour détecter une différence. Pour plus d'informations, reportez-vous à la rubrique Qu'est-ce que la puissance ?.

Minitab utilise le nombre total d'occurrences, l'effectif de l'échantillon (N) et la durée d'observation pour calculer la fréquence (taux) d'échantillon. Par exemple, des inspecteurs vérifient le nombre de défauts dans des paquets de serviettes de 2 lignes d'assemblage (A et B). Chaque serviette peut présenter plusieurs défauts, comme 1 déchirure et 2 accrocs, soit 3 défauts. Pour la ligne d'assemblage A, chaque paquet contient 10 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 112 défauts. Pour la ligne d'assemblage B, chaque paquet contient 15 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 132 défauts.
  • Pour la ligne d'assemblage A, le nombre total d'occurrences est de 112, car les inspecteurs ont relevé 112 défauts. Pour la ligne d'assemblage B, le nombre total d'occurrences est de 132, car les inspecteurs ont relevé 132 défauts.
  • L'effectif de l'échantillon (N) est de 50 pour les deux lignes d'assemblage, car les inspecteurs ont constitué des échantillons de 50 paquets pour les deux lignes.
  • Pour déterminer le nombre de défauts par serviette, les inspecteurs utilisent une durée d'observation de 10 pour la ligne d'assemblage A, car un paquet contient 10 serviettes. Pour la ligne d'assemblage B, les inspecteurs utilisent une durée d'observation de 15.
  • Pour la ligne d'assemblage A, la fréquence (taux) d'échantillon est égale à : (nombre total d'occurrences / N) / (durée d'observation) = (112 / 50) / 10 = 0,224. Pour la ligne d'assemblage B, la fréquence (taux) d'échantillon est égale à : (132 / 50) / 15 = 0,176. Ainsi, chaque serviette comporte en moyenne 0,244 défaut pour la ligne d'assemblage A et 0,176 défaut pour la ligne d'assemblage B.
  • Comme les inspecteurs entrent une durée d'observation autre que 1, Minitab calcule également la moyenne d'échantillon. Pour la ligne d'assemblage A, la moyenne d'échantillon este égal à : (nombre total d'occurrences / N) = 112/50 = 2,24. Pour la ligne d'assemblage B, la moyenne d'échantillon est égale à : (132 / 50) = 2,64. La moyenne d'échantillon décrit le nombre moyen de défauts par paquet. Toutefois, comme les paquets ne contiennent pas tous le même nombre de serviettes, la fréquence (taux) d'échantillon est une statistique plus utile.

Fréquence (taux) d'échantillon

La fréquence (taux) d'échantillon d'un événement est le nombre moyen d'occurrences de cet événement par unité de durée d'observation dans l'échantillon.

Interprétation

La fréquence de chaque échantillon est une estimation de la fréquence de population de chaque échantillon.

Minitab utilise le nombre total d'occurrences, l'effectif de l'échantillon (N) et la durée d'observation pour calculer la fréquence (taux) d'échantillon. Par exemple, des inspecteurs vérifient le nombre de défauts dans des paquets de serviettes de 2 lignes d'assemblage (A et B). Chaque serviette peut présenter plusieurs défauts, comme 1 déchirure et 2 accrocs, soit 3 défauts. Pour la ligne d'assemblage A, chaque paquet contient 10 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 112 défauts. Pour la ligne d'assemblage B, chaque paquet contient 15 serviettes. Les inspecteurs constituent un échantillon de 50 paquets et relèvent un total de 132 défauts.
  • Pour la ligne d'assemblage A, le nombre total d'occurrences est de 112, car les inspecteurs ont relevé 112 défauts. Pour la ligne d'assemblage B, le nombre total d'occurrences est de 132, car les inspecteurs ont relevé 132 défauts.
  • L'effectif de l'échantillon (N) est de 50 pour les deux lignes d'assemblage, car les inspecteurs ont constitué des échantillons de 50 paquets pour les deux lignes.
  • Pour déterminer le nombre de défauts par serviette, les inspecteurs utilisent une durée d'observation de 10 pour la ligne d'assemblage A, car un paquet contient 10 serviettes. Pour la ligne d'assemblage B, les inspecteurs utilisent une durée d'observation de 15.
  • Pour la ligne d'assemblage A, la fréquence (taux) d'échantillon est égale à : (nombre total d'occurrences / N) / (durée d'observation) = (112 / 50) / 10 = 0,224. Pour la ligne d'assemblage B, la fréquence (taux) d'échantillon est égale à : (132 / 50) / 15 = 0,176. Ainsi, chaque serviette comporte en moyenne 0,244 défaut pour la ligne d'assemblage A et 0,176 défaut pour la ligne d'assemblage B.
  • Comme les inspecteurs entrent une durée d'observation autre que 1, Minitab calcule également la moyenne d'échantillon. Pour la ligne d'assemblage A, la moyenne d'échantillon este égal à : (nombre total d'occurrences / N) = 112/50 = 2,24. Pour la ligne d'assemblage B, la moyenne d'échantillon est égale à : (132 / 50) = 2,64. La moyenne d'échantillon décrit le nombre moyen de défauts par paquet. Toutefois, comme les paquets ne contiennent pas tous le même nombre de serviettes, la fréquence (taux) d'échantillon est une statistique plus utile.

Moyenne de l'échantillon

Lorsque la durée observée est différente de 1, Minitab affiche la moyenne d'échantillon. La moyenne d'échantillon est égale au nombre total d'occurrences divisé par l'effectif d'échantillon. Toutefois, comme la durée d'observation diffère de 1, la fréquence (taux) d'échantillon sera souvent plus utile dans votre cas particulier.

Différence estimée

La différence estimée est la différence entre les taux d'occurrence des deux échantillons.

La différence étant calculée à partir des données d'échantillon et non de l'ensemble de la population, il est peu probable que la différence de l'échantillon soit égale à celle de la population. Pour mieux estimer la différence de la population, utilisez l'intervalle de confiance.

Bornes et intervalle de confiance (IC)

L'intervalle de confiance fournit une étendue de valeurs probables pour la différence de la population. Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Toutefois, si vous répétiez l'échantillonnage de nombreuses fois, un certain pourcentage des intervalles de confiance ou bornes obtenus contiendrait la différence de population inconnue. Le pourcentage de ces intervalles de confiance ou bornes contenant la différence est le niveau de confiance de l'intervalle. Par exemple, un niveau de confiance de 95 % indique que, sur 100 échantillons pris de façon aléatoire parmi la population, environ 95 de ces échantillons devraient produire des intervalles contenant la différence de population.

Une borne supérieure définit une valeur à laquelle la différence de la population est susceptible d'être inférieure. Une borne inférieure définit une valeur à laquelle la différence de la population est susceptible d'être supérieure.

L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon. Pour plus d'informations, reportez-vous à la rubrique Obtenir un intervalle de confiance plus précis.

Estimation de la différence

Différence
estimée
IC à 95% pour la
différence
-7,7(-14,6768; -0,723175)

Dans ces résultats, l'estimation du taux d'occurrence de la population pour la différence de visites de clients dans deux bureaux de poste est de −7,7. Vous pouvez être sûr à 95 % que la différence de taux de population est comprise entre −14,7 et −0,7 environ.

Hypothèse nulle et hypothèse alternative

Le test de différence affiche les hypothèses nulle et alternative. Les hypothèses nulle et alternative sont deux déclarations s'excluant mutuellement sur une population. Un test d'hypothèse utilise des données échantillons pour déterminer si l'hypothèse nulle peut être rejetée.
Hypothèse nulle
L'hypothèse nulle affirme qu'un paramètre de la population (la moyenne, l'écart type, etc.) est égal à une valeur hypothétisée. L'hypothèse nulle est souvent une déclaration initiale basée sur des analyses précédentes ou des connaissances spécialisées.
Hypothèse alternative
L'hypothèse alternative affirme qu'un paramètre de la population est plus petit, plus grand ou différent de la valeur hypothétisée dans l'hypothèse nulle. L'hypothèse alternative est celle que vous pensez être vraie ou que vous espérez démontrer.

Dans les résultats, les hypothèses nulle et alternative vous permettent de vérifier que vous avez saisi une valeur correcte pour le test de la différence.

Valeur de Z

La valeur de Z est une statistique de test pour les tests Z qui mesure la différence entre une statistique observée et son paramètre de population hypothétisé, en unités d'erreur type.

Interprétation

Vous pouvez comparer la valeur de Z aux valeurs critiques de la loi normale standard pour déterminer s'il faut rejeter l'hypothèse nulle. Cependant, il est souvent plus pratique et plus commode d'utiliser la valeur de p du test pour cela.

Pour savoir si l'hypothèse nulle doit être rejetée, comparez la valeur de Z à votre valeur critique. La valeur critique est Z1-α/2 pour un test bilatéral et Z1-α pour un test unilatéral. Pour un test bilatéral, si la valeur absolue de Z est supérieure à la valeur critique, vous rejetez l'hypothèse nulle. Si la valeur absolue de Z est supérieure à la valeur critique, vous rejetez l'hypothèse nulle. Vous pouvez calculer la valeur critique dans Minitab ou rechercher la valeur critique dans un tableau de loi normale standard, disponible dans la plupart des livres de statistiques. Pour plus d'informations, accédez à la rubrique Utilisation de la fonction de répartition (CDF) inverse et cliquez sur "Utiliser la CDF inverse pour calculer des valeurs critiques".

La valeur de Z sert à calculer la valeur de p.

valeur de p

La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Une valeur de p inférieure fournit des preuves plus solides par rapport à l'hypothèse nulle.

Interprétation

Utilisez la valeur de p pour déterminer si la différence entre des taux d'occurrence de la population est statistiquement significative.

Pour déterminer si la différence entre les taux d'occurrence est statistiquement significative, comparez la valeur de p au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'une différence existe.
Valeur de p ≤ α : la différence entre les taux est statistiquement significative (Rejeter H0)
Si la valeur de p est inférieure ou égale au seuil de signification, vous rejetez l'hypothèse nulle. Vous pouvez conclure que la différence entre les taux de population n'est pas égale à la différence hypothétisée. Si vous n'avez pas spécifié de différence hypothétisée, Minitab vérifie l'absence de différence entre les taux (Différence hypothétisée = 0). Utilisez vos connaissances afin de déterminer si la différence est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Signification statistique et pratique.
Valeur de p > α : la différence entre les taux n'est pas statistiquement significative (Impossible de rejeter H0)
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas rejeter l'hypothèse nulle. Vous ne disposez pas des preuves suffisantes pour conclure que les taux de population sont différents. Vous devez vous assurer que votre test est assez puissant pour détecter une différence qui est significative dans la pratique. Pour plus d'informations, reportez-vous à la rubrique Puissance et effectif de l'échantillon pour un test de Poisson à 2 échantillons.

Lorsque la différence hypothétisée est égale à 0, Minitab teste l'hypothèse nulle avec une procédure exacte. La valeur de p pour le test exact est le résultat de cette procédure exacte. L'autre valeur de p repose sur l'approximation selon la loi normale et peut être inexacte si le nombre total d'occurrences est faible.