Interpretar una prueba de bondad de ajuste y elegir una distribución

Para un nivel de significancia (α) seleccionado antes de realizar la prueba, un valor p (P) menor que α indica que los datos no siguen esa distribución.

Minitab realiza pruebas de bondad de ajuste con los datos para una variedad de distribuciones y estima sus parámetros. Elija la distribución que mejor se ajuste a los datos y sea la más adecuada para el análisis. Si más de una distribución se ajusta sus datos, seleccione la distribución con el valor p más grande. Si ninguna distribución se ajusta a sus datos, considere un análisis no paramétrico.

  1. Examine solo las distribuciones básicas primero (no considere distribuciones con parámetros de valor umbral, como la exponencial de 2 parámetros o la lognormal de 3 parámetros).
  2. Determine qué distribuciones tienen los valores p más altos. Si ninguna de las distribuciones tiene valores p mayores que el valor del nivel de significancia (0,05), entonces ninguna de las distribuciones se ajusta de forma adecuada a los datos.
  3. Considere las variaciones de 2 y de 3 parámetros de las distribuciones que parecen ser adecuadas.
Entre los valores p muy cercanos, seleccione:
  • Una distribución que haya utilizado previamente para un conjunto de datos similar.
  • Una distribución basada en los estadísticos de capacidad.
  • La distribución que sea más conservadora.

Elegir entre una distribución de 3 parámetros y una de 2 parámetros

Para cada distribución de 3 parámetros, excepto la distribución de Weibull, no existe ningún método establecido para calcular el valor p, así que debe utilizar la prueba de relación de verosimilitud (LRT).

  1. Primero, examine el valor p de la distribución de dos parámetros correspondiente para evaluar el ajuste.
  2. Luego examine el valor p de LRT para la distribución de 3 parámetros para determinar si la distribución de 3 parámetros es significativamente mejor que la distribución de dos parámetros. Para Identificación de distribución individual, un valor p para la prueba de relación de verosimilitud (P de LRT) menor que el nivel de significancia indica que para las distribuciones que tienen un parámetro adicional opcional, agregar este parámetro adicional mejora significativamente el ajuste de la distribución. Por ejemplo, P de LRT le ayuda a elegir entre la distribución exponencial (que tiene 1 parámetro) y la distribución exponencial de 2 parámetros o entre la distribución de Weibull (que tiene 2 parámetros) y la distribución de Weibull de 3 parámetros.

    Además, una inspección visual de la gráfica de probabilidad combinada con el valor de Anderson-Darling puede ayudar a indicar si la distribución ofrece un buen ajuste. Sin embargo, puede ser mejor elegir una distribución que tenga un valor p calculado y un valor de Anderson-Darling similar.

¿Por qué algunos valores p se dan como una aproximación y no como un valor exacto?

Para algunas distribuciones existe una expresión de forma cerrada para el valor p y, por lo tanto, se puede obtener un valor p exacto. Sin embargo, para algunas otras distribuciones no existe una expresión de forma cerrada, pero se dispone de tablas de rangos de valores p, obtenidos a través de estudios de simulación. Para estas distribuciones, Minitab solo puede informar un límite inferior y/o superior para el valor p.

¿Por qué algunos valores p se muestran como asteriscos en la salida?

Se muestra un asterisco en lugar de un valor p para las distribuciones lognormal de 3 parámetros, gama de 3 parámetros y loglogística de 3 parámetros. El asterisco indica que Minitab no puede calcular un valor p para esa distribución.