Métodos e fórmulas para Teste de outlier

Selecione o método ou a fórmula de sua escolha.

Estatística de teste de Dixon

O teste de Dixon determina se o valor mais extremo em uma amostra é um outlier. O teste de Dixon inclui uma escolha da estatística de teste que supere os potenciais efeitos de encobrimento de outros valores extremos na amostra. A estatística do teste de Dixon é indicada por rij , onde os subscritos i e j indicam o seguinte:
  • i indica o número de valores extremos do mesmo lado (superior ou inferior) dos dados que o outlier suspeito. i = 1 ou 2.
  • i indica o número de valores extremos do lado oposto dos dados. i = 0, 1 ou 2.

Por exemplo, se o outlier suspeito é o menor valor na amostra, mas a amostra inclui também dois valores atipicamente grandes, então r12 é a estatística de teste apropriada. A estatística de teste r10 , (também chamada de Q de Dixon), é apropriada quando a amostra inclui apenas um valor extremo.

Os valores críticos para as estatísticas dos testes de Dixon são tabulados em Rorabacher (1991).

Estatística de teste unilateral

A fórmula para o teste unilateral depende se você testar o menor valor, yi , ou o maior valor, yn. Para testar se yi , é o outlier, use a seguinte fórmula:
Para testar se yn , é o outlier, use a seguinte fórmula:

Estatística de teste bilateral

Nós definimos a estatística de teste bilateral como King (1953) define a estatística de teste bilateral relacionada com r10. A estatística de teste de bilateral é dada por:

Notação

TermoDescrição
rijEstatística de teste de Dixon (i = 1, 2; j = 0, 1, 2)
yio io menor valor na amostra
no número de observações na amostra

Referências

  • D.B. Rorabacher (1991). "Statistical Treatment for Rejection of Deviant Values: Critical Values of Dixon Q Parameter and Related Subrange Ratios at the 95 percent Confidence Level," Analytic Chemistry, 83, 2, 139-146.
  • E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the American Statistical Association, Vol. 48, No. 263, 531-533.

Estatística de teste de Grubbs

Fórmula para a estatística unilateral

Se você testar se o menor valor de dados é um outlier, então a estatística de teste G é dada por:
Se você testar se o maior valor de dados é um outlier, então a estatística de teste G é dada por:

Fórmula para a estatística bilateral

Para uma hipótese bilateral, G é dado por:

Notação

TermoDescrição
a média da amostra
yio io menor valor na amostra
so desvio padrão da amostra
no número de observações na amostra

Valores de p para a estatística de teste de Dixon

Partindo-se do princípio de que os dados são normalmente distribuídos, a estatística de Dixon tem a mesma distribuição se você testar o menor valor ou o maior valor. Assim, sem qualquer perda de generalidade, podemos nos concentrar nas estatísticas para a detecção de outliers no final extremo dos dados, a saber:

Função distribuição acumulada para o teste estatístico

De acordo com Dixon (1951) e McBane (2006), as funções densidade de probabilidade da distribuição da estatística de teste rij pode ser escrita como:
em que C é o fator de normalização especificado por:
e a J(x,v,r) jacobiana é especificada por:
Usando a transformação onde t = (1 + r2 ) v2 / 2 e u2 = 3x2 / 2, a função de densidade pode ser reescrita como:

O Minitab avalia a integral interna usando uma quadratura Gauss-Laguerre de 30 pontos. O Minitab avalia a integral externa usando uma quadratura Gauss-Hermite de 30 pontos.

As funções de distribuição acumuladas para a família de estatísticas de teste são especificadas por:

De forma semelhante a McBane (2006), o Minitab calcula Fij(r) usando um método de quadradura de Gauss-Legendre de 16 pontos.

Valor de p para teste unilateral

Para qualquer par de índices (i, j), o valor de p para a estatística unilateral observado, R, é especificado por:

Valor de p para teste unilateral

Usando os resultados de King (1953), para qualquer par de subscritos (i, j), o valor de p para a estatística de bilateral observada, r, é especificado por:

Além disso, King observa que a aproximação acima torna-se uma igualdade para .

Notação

TermoDescrição
rija estatística de teste de Dixon em que i = 1, 2; j = 0, 1, 2
yio io menor valor na amostra
no número de observações na amostra

Referências

W.J. Dixon (1951). "Ratios Involving Extreme Values," Annals of Mathematical Statistics, 22(1), 68-78.

E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the American Statistical Association, Vol. 48, No. 263, pages 531-533.

G.C. McBane (2006). "Programs to Compute Distribution Functions and Critical Values for Extreme Value Ratios for Outlier Detection," Journal of Statistical Software, Vol. 16, No. 3, pages 1-9.

Valores de p para a estatística de teste de Grubbs

Fórmula para um teste unilateral

O valor de p para um teste unilateral é:

Fórmula para um teste bilateral

O valor de p para um teste bilateral é:

Valores de p exatos versus aproximados

Se o seguinte for verdadeiro, então o valor de p é exato.

Se não, o valor de p calculado representa um limite superior para o valor de p exato. No entanto, o limite superior é uma aproximação muito boa do valor de p exato.

Notação

TermoDescrição
GEstatística de teste de Grubbs
no número de observações na amostra
Tuma variável aleatória distribuída como uma distribuição t com n – 2 graus de liberdade