Par exemple, si la valeur aberrante soupçonnée est la plus petite valeur de l'échantillon, mais que celui-ci comprend également deux valeurs inhabituellement grandes, alors r12 est la statistique de test adaptée. La statistique de test r10 (aussi appelée test Q de Dixon) est adaptée lorsque l'échantillon comprend seulement une valeur extrême.
Les valeurs critiques pour les statistiques de test de Dixon sont tabulées d'après Rorabacher (1991).
Terme | Description |
---|---|
rij | statistique de test de Dixon (i = 1, 2 ; j = 0, 1, 2) |
yi | ie plus petite valeur de l'échantillon |
n | nombre d'observations dans l'échantillon |
Terme | Description |
---|---|
moyenne de l'échantillon | |
yi | ie plus petite valeur de l'échantillon |
s | écart type de l'échantillon |
n | nombre d'observations dans l'échantillon |
Minitab évalue l'entier interne à l'aide d'une quadrature à 30 points de Gauss-Laguerre. Minitab évalue l'entier externe à l'aide d'une quadrature à 30 points de Gauss-Laguerre.
Comme McBane (2006), Minitab calcule Fij(r) à l'aide de la méthode de quadrature à 16 points de Gauss-Laguerre.
Par ailleurs, King observe que l'approximation ci-dessus devient une égalité pour .
Terme | Description |
---|---|
rij | statistique de Dixon, où i = 1, 2; j = 0, 1, 2 |
yi | ie plus petite valeur de l'échantillon |
n | nombre d'observations dans l'échantillon |
W. J. Dixon (1951), "Ratios Involving Extreme Values", Annals of Mathematical Statistics, 22(1), 68-78.
E. P. King (1953), "On Some Procedures for the Rejection of Suspected Data", Journal of the American Statistical Association, vol. 48, No. 263, pages 531-533.
G. C. McBane (2006), "Programs to Compute Distribution Functions and Critical Values for Extreme Value Ratios for Outlier Detection", Journal of Statistical Software, vol. 16, No. 3, pages 1-9.
Dans le cas contraire, la valeur de p calculée représente une borne supérieure pour la valeur de p exacte. Cependant, la borne supérieure donne une très bonne idée de la valeur exacte de p.
Terme | Description |
---|---|
G | statistique de test de Grubb |
n | nombre d'observations dans l'échantillon |
T | variable aléatoire distribuée selon la loi de distribution t, avec n - 2 degrés de liberté |