Métodos para Identificación de distribución individual

Estimaciones de máxima verosimilitud

Las estimaciones de máxima verosimilitud de los parámetros en la distribución se calculan maximizando la función de verosimilitud con respecto a los parámetros. Para un conjunto de datos dado, la función de verosimilitud de una distribución estima la probabilidad de generar los datos en esa distribución.

El algoritmo de Newton-Raphson se utiliza para calcular las estimaciones de máxima verosimilitud de los parámetros que definen la distribución. El algoritmo de Newton-Raphson es un método recursivo para calcular el máximo de una función. 1 Luego, los percentiles se calculan a partir de la distribución.

Nota

Minitab calcula las estimaciones de parámetros utilizando el método de máxima verosimilitud para todas las distribuciones, excepto las distribuciones normal y lognormal. Para la distribución normal y la distribución lognormal, Minitab calcula estimaciones de parámetros sin sesgo.

Prueba de bondad de ajuste

Minitab utiliza el estadístico de Anderson-Darling para realizar la prueba de bondad de ajuste.

Sea Z = F(X), donde F(X) es la función de distribución acumulada. Supongamos que una muestra X1, .., Xn provee valores Z(i) = F(Xi), i=1,.., n. Reorganice Z(i) en orden ascendente, Z(1) < Z(2) <...<Z(n). Luego el estadístico de Anderson-Darling (A2) se calcula de la siguiente manera:

  • A2 = –n - (1/n) Σi[(2i – 1) log Z(i) + (2n + 1 – 2i) log (1 – Z(i))]

El estadístico de la prueba de bondad de ajuste de Anderson-Darling modificado se calcula para cada distribución. Los valores p se basan en las tablas 4.8−4.22 en D'Agostino y Stephens2 Si no se encuentra un valor p exacto en la tabla, Minitab calcula el valor p con base en interpolación usando el rango del valor p.

Nota

Los valores p para la prueba de Anderson-Darling no están disponibles para distribuciones de 3 parámetros, excepto la distribución de Weibull.

Prueba de relación de verosimilitud

La prueba de relación de verosimilitud compara el ajuste de una familia de distribución más grande con un subconjunto de la misma familia y determina si hay una mejora significativa en el ajuste con la distribución más grande. Por ejemplo, para una distribución exponencial de 2 parámetros, la prueba de relación de verosimilitud compara el ajuste de la familia de distribución exponencial de 2 parámetros con el ajuste de la familia de distribución exponencial de 1 parámetro (un subconjunto donde el segundo parámetro es 0). Si una distribución exponencial de 2 parámetros mejora significativamente el ajuste, entonces el valor p del estadístico de la prueba de relación de verosimilitud es muy pequeño.

El estadístico de la prueba de relación de verosimilitud se calcula de la siguiente manera.

Sea A la estimación de máxima verosimilitud (MLE) del vector del parámetro de la familia de distribución más grande (por ejemplo, la familia de distribución de 3 parámetros) y L(A) la log-verosimilitud. Sea B la MLE del vector del parámetro de la familia de distribución más pequeña correspondiente (por ejemplo, la familia de distribución de 2 parámetros correspondiente) y L(B) la log-verosimilitud.

Estadístico de la prueba de relación de verosimilitud = 2 * L(A) 2 * L(B).

En la hipótesis nula, la familia de distribución más pequeña ajusta adecuadamente los datos. El estadístico de la prueba de relación de verosimilitud tiene distribución de chi-cuadrada con df = dimensión del vector (A) – dimensión del vector (B).

1 W. Murray, Ed. (1972). Numerical Methods for Unconstrained Optimization. Academic Press.
2 M.A. Stephens (1986). Chapter 4: Tests based on EDF statistics. Goodness-of-Fit Techniques, ed. R.B. D'Agostino y M.A. Stephens. Marcel Dekker, Inc. 97-193.