Métodos y fórmulas para Prueba de valores atípicos

Seleccione el método o la fórmula de su preferencia.

Estadísticos de la prueba de Dixon

La prueba de Dixon determina si el valor más extremo de una muestra es un valor atípico. La prueba de Dixon incluye una selección de estadísticos de prueba que superan los posibles efectos de enmascaramiento de otros valores extremos en la muestra. El estadístico de la prueba de Dixon se denota mediante rij, donde los subíndices i y j indican lo siguiente:
  • i indica el número de valores extremos en el mismo lado (inferior o superior) de los datos que el supuesto valor atípico. i = 1 o 2.
  • j indica el número de valores extremos en el lado opuesto de los datos. j = 0, 1 o 2.

Por ejemplo, si el supuesto valor atípico es el valor más pequeño en la muestra, pero la muestra también incluye dos valores extrañamente grandes, entonces r12 es el estadístico de prueba adecuado. El estadístico de prueba r10 (también denominado Q de Dixon) es adecuado cuando la muestra solo incluye un valor extremo.

Los valores críticos para los estadísticos de la prueba de Dixon se tabulan en Rorabacher (1991).

Estadísticos de prueba unilaterales

La fórmula para la prueba unilateral depende de si usted evalúa el valor más pequeño, yi, o el valor más grande, yn. Para probar si yi es el valor atípico, utilice la siguiente fórmula:
Para probar si yn es el valor atípico, utilice la siguiente fórmula:

Estadísticos de prueba bilaterales

Nosotros definimos el estadístico de prueba bilateral como King (1953) define el estadístico de prueba bilateral relacionado con r10. El estadístico de prueba bilateral viene dado por:

Notación

TérminoDescription
rijEstadístico de la prueba de Dixon (i = 1, 2; j = 0, 1, 2)
yiel iésimo valor más pequeño en la muestra
nel número de observaciones en la muestra

Referencias

  • D.B. Rorabacher (1991). "Statistical Treatment for Rejection of Deviant Values: Critical Values of Dixon Q Parameter and Related Subrange Ratios at the 95 percent Confidence Level," Analytic Chemistry, 83, 2, 139-146.
  • E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the American Statistical Association, Vol. 48, No. 263, 531-533.

Estadístico de la prueba de Grubbs

Fórmula para el estadístico unilateral

Si usted evalúa si el valor de datos más pequeño es un valor atípico, entonces el estadístico de prueba G viene dado por:
Si usted evalúa si el valor de datos más grande es un valor atípico, entonces G viene dado por:

Fórmula para el estadístico bilateral

Para una hipótesis bilateral, G viene dado por:

Notación

TérminoDescription
la media de la muestra
yiel iésimo valor más pequeño en la muestra
sla desviación estándar de la muestra
nel número de observaciones en la muestra

Valores p para los estadísticos de la prueba de Dixon

Si presuponemos que los datos están distribuidos normalmente, los estadísticos de Dixon tienen la misma distribución independientemente de que se pruebe el valor más pequeño o el valor más grande. Por lo tanto, sin ninguna pérdida de generalidad, podemos enfocarnos en los estadísticos para detectar valores atípicos en el extremo alto de los datos, específicamente:

Función de distribución acumulada para el estadístico de prueba

De acuerdo con Dixon (1951) y McBane (2006), las funciones de densidad de probabilidad de la distribución de los estadísticos de prueba rij se pueden escribir de la siguiente manera:
donde C es el factor normalizador especificado por:
y la J jacobiana (x,v,r) se especifica mediante:
Utilizando la transformación donde t = (1 + r2 ) v2 / 2 y u2 = 3x2 / 2, la función de densidad se puede reescribir de la siguiente manera:

Minitab evalúa la integral interna utilizando una cuadratura de Gauss-Laguerre de 30 puntos. Minitab evalúa la integral externa utilizando una cuadratura de Gauss-Hermite de 30 puntos.

Las funciones de distribución acumulada para la familia de estadísticos de prueba se especifican mediante:

Como lo hace McBane (2006), Minitab calcula Fij(r) utilizando un método de cuadratura de Gauss-Legendre de 16 puntos.

Valor p para una prueba unilateral

Para cualquier par de subíndices (i, j), el valor p para el estadístico unilateral observado, r, se especifica mediante:

Valor p para una prueba unilateral

Utilizando el resultado de King (1953), para cualquier par de subíndices (i, j), el valor p del estadístico bilateral observado, r, se especifica mediante:

Además, King observa que la aproximación anterior se convierte en una igualdad para .

Notación

TérminoDescription
rijel estadístico de la prueba de Dixon donde i = 1, 2; j = 0, 1, 2
yiel iésimo valor más pequeño en la muestra
nel número de observaciones en la muestra

Referencias

W.J. Dixon (1951). "Ratios Involving Extreme Values," Annals of Mathematical Statistics, 22(1), 68-78.

E.P. King (1953). "On Some Procedures for the Rejection of Suspected Data," Journal of the American Statistical Association, Vol. 48, No. 263, páginas 531-533.

G.C. McBane (2006). "Programs to Compute Distribution Functions and Critical Values for Extreme Value Ratios for Outlier Detection," Journal of Statistical Software, Vol. 16, No. 3, páginas 1-9.

Valores p para el estadístico de la prueba de Grubbs

Fórmula para una prueba unilateral

El valor p para una prueba unilateral es:

Fórmula para una prueba bilateral

El valor p para la prueba bilateral es:

Valores p exactos vs. aproximados

Si se cumple lo siguiente, entonces el valor p es exacto.

De lo contrario, el valor p calculado representa un límite superior del valor p exacto. Sin embargo, el límite superior es una aproximación muy adecuada al valor p exacto.

Notación

TérminoDescription
GEstadístico de la prueba de Grubbs
nel número de observaciones en la muestra
Tuna variable aleatoria distribuida como una distribución t con n – 2 grados de libertad