Bondad de ajuste para Identificación de distribución individual

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos de bondad de ajuste que se proporcionan con la identificación de distribución individual.

Gráfica de probabilidad

Una gráfica de probabilidad muestra cada punto de datos versus el porcentaje de valores en la muestra que son menores o iguales a este valor.
La gráfica incluye:
Línea intermedia
El percentil esperado de la distribución con base en estimaciones del parámetro de probabilidad máxima.
Líneas de bordes de confianza
Una línea izquierda curva indica los bordes inferiores de los intervalos de confianza para los percentiles. Una línea derecha curva indica los bordes superiores de los intervalos de confianza para los percentiles.

Interpretación

Utilice la gráfica de probabilidad para evaluar en qué grado sus datos siguen cada distribución.

Si la distribución provee un ajuste adecuado para los datos, los puntos deben ubicarse cerca de la línea de distribución ajustada, a lo largo de la misma. Alejamientos de la línea recta indican que el ajuste es inaceptable.

Ajuste adecuado
Ajuste deficiente

Además de la gráfica de probabilidad, utilice las medidas de bondad de ajuste, tales como los valores p para AD y los valores p para LRT, para evaluar el ajuste de distribución.

Al seleccionar una distribución para modelar sus datos, también utilice su conocimiento del proceso. Si varias distribuciones proporcionan un buen ajuste, use las siguientes estrategias para elegir una distribución:
  • Elija la distribución que se utiliza más frecuentemente en su industria o aplicación.
  • Elija la distribución que proporciona los resultados más conservadores. Por ejemplo, si usted realiza un análisis de capacidad, puede realizar el análisis utilizando diferentes distribuciones y luego elegir la distribución que produzca los índices de capacidad más conservadores. Para obtener más información, vaya a Percentiles de distribución para Identificación de distribución individual y haga clic en "Porcentajes y percentiles".
  • Elija la distribución más simple que se ajuste adecuadamente a sus datos. Por ejemplo, si tanto una distribución de 2 parámetros como otra de 3 parámetros proporcionan un buen ajuste, usted podría elegir la distribución más simple de 2 parámetros.

P

Para cada distribución, Minitab indica un valor p (P) para la prueba de Anderson-Darling (AD). El valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Para una prueba AD, la hipótesis nula es que los datos siguen la distribución. Por lo tanto, valores p más bajos proporcionan fuerte evidencia de que los datos no siguen la distribución.
Nota

Ningún valor p para la prueba de AD está disponible para las distribuciones de 3 parámetros, excepto por la distribución de Weibull.

Interpretación

Utilice el valor p para evaluar el ajuste de la distribución.

Compare el valor p de cada distribución o transformación con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que los datos no siguen la distribución, cuando en realidad sí lo hacen.
P ≤ α: Los datos no siguen la distribución (Rechaza H0)
Si el valor p es menor que o igual al nivel de significancia, la decisión es rechazar la hipótesis nula y concluir que sus datos no siguen la distribución.
P > α: No puede concluir que los datos no siguen la distribución (No puede rechazar H0)
Si el valor p es mayor que el nivel de significancia, la decisión es que no se puede rechazar la hipótesis nula. No existe suficiente evidencia para concluir que los datos no siguen la distribución. Usted puede presuponer que los datos siguen la distribución.
Al seleccionar una distribución para modelar sus datos, también utilice su conocimiento del proceso. Si varias distribuciones proporcionan un buen ajuste, use las siguientes estrategias para elegir una distribución:
  • Elija la distribución que se utiliza más frecuentemente en su industria o aplicación.
  • Elija la distribución que proporcione los resultados más conservadores. Por ejemplo, si usted realiza un análisis de capacidad, puede realizar el análisis utilizando diferentes distribuciones y luego elegir la distribución que produzca los índices de capacidad más conservadores. Para obtener más información, vaya a Percentiles de distribución para Identificación de distribución individual y haga clic en "Porcentajes y percentiles".
  • Elija la distribución más simple que se ajuste adecuadamente a sus datos. Por ejemplo, si tanto una distribución de 2 parámetros como otra de 3 parámetros proporcionan un buen ajuste, usted podría elegir la distribución más simple de 2 parámetros.
Important

Interprete los resultados de una muestra muy pequeña o muy grande con precaución. Si tiene una muestra muy pequeña, una prueba de bondad de ajuste pudiera no tener suficiente potencia para detectar alejamientos significativos de la distribución. Si tiene una muestra muy grande, la prueba pudiera tener tanta potencia que detecte alejamientos incluso pequeños de la distribución que no tengan significancia práctica. Utilice las gráficas de probabilidad, además de los valores p, para evaluar el ajuste de distribución.

Identificación de la distribución para Calcio

Exponencial de 2 parámetros

* ADVERTENCIA * La matriz de varianzas y covarianzas de los parámetros estimados no existe. Se supone que el parámetro de valor umbral es fijo cuando se calculan intervalos de confianza. Gamma de 3 parámetros
* ADVERTENCIA * La matriz de varianzas y covarianzas de los parámetros estimados no existe. Se supone que el parámetro de valor umbral es fijo cuando se calculan intervalos de confianza. Gráfica de ID de distribución para Calcio

Gráfica de ID de distribución para Calcio

Gráfica de ID de distribución para Calcio

Gráfica de ID de distribución para Calcio

Estadísticas descriptivas N N* Media Desv.Est. Mediana Mínimo Máximo Asimetría Curtosis 50 0 50.782 2.76477 50.4 46.8 58.1 0.644923 -0.287071
transformación de Box-Cox: λ = -4 Función de Transformación de Johnson: 0.804604 + 0.893699 × Ln( ( X - 46.2931 ) / ( 59.8636 - X ) )
Prueba de bondad del ajuste Distribución AD P LRT P Normal 0.754 0.046 Transformación Box-Cox 0.414 0.324 Lognormal 0.650 0.085 Lognormal de 3 parámetros 0.341 * 0.017 Exponencial 20.614 <0.003 Exponencial de 2 parámetros 1.684 0.014 0.000 Weibull 1.442 <0.010 Weibull de 3 parámetros 0.230 >0.500 0.000 Valor extremo más pequeño 1.656 <0.010 Valor extremo por máximos 0.394 >0.250 Gamma 0.702 0.071 Gamma de 3 parámetros 0.268 * 0.006 Logística 0.726 0.034 Loglogística 0.659 0.050 Loglogística de 3 parámetros 0.432 * 0.027 Transformación de Johnson 0.124 0.986
Estimaciones ML de los parámetros de distribución Distribución Ubicación Forma Escala Valor umbral Normal* 50.78200 2.76477 Transformación de Box-Cox* 0.00000 0.00000 Lognormal* 3.92612 0.05368 Lognormal de 3 parámetros 1.69295 0.46849 44.74011 Exponencial 50.78200 Exponencial de 2 parámetros 4.06326 46.71873 Weibull 17.82470 52.13681 Weibull de 3 parámetros 1.47605 4.53647 46.66579 Valor extremo más pequeño 52.22257 2.95894 Valor extremo por máximos 49.50370 2.16992 Gamma 351.04421 0.14466 Gamma de 3 parámetros 2.99218 1.63698 45.88376 Logística 50.57182 1.59483 Loglogística 3.92259 0.03121 Loglogística de 3 parámetros 1.54860 0.32763 45.46180 Transformación de Johnson* 0.02897 0.97293 * Escala: Estimación de ML ajustado

En estos resultados, varias distribuciones tienen un valor p mayor que 0.05. La distribución de Weibull de 3 parámetros (P > 0.500) y la distribución de valor extremo más grande (P > 0.250) tienen los mayores valores p y parecen ajustarse a los datos de la muestra mejor que las demás distribuciones. Además, la transformación de Box-Cox (P = 0.324) y la transformación de Johnson (P = 0.986) son efectivas al transformar los datos para que sigan una distribución normal.

Nota

Para varias distribuciones, Minitab también muestra los resultados de la distribución con un parámetro adicional. Por ejemplo, para la distribución lognormal, Minitab muestra los resultados de las versiones tanto de 2 parámetros como de 3 parámetros de la distribución. Para distribuciones que tienen parámetros adicionales, utilice el valor p para la prueba de relación de verosimilitud (LRT P) a fin de determinar si agregar otro parámetro mejora significativamente el ajuste de la distribución. Un valor p para LRT menor que 0.05 sugiere que la mejora en el ajuste es significativa. Para obtener más información, véase la sección sobre LRT P.

LRT P

Para varias distribuciones, Minitab también muestra los resultados de la distribución con un parámetro adicional. Para cada versión de una distribución con un parámetro adicional, Minitab indica un valor p para la prueba de relación de verosimilitud (LRT P). Un valor p es una probabilidad que mide la evidencia en contra de la hipótesis nula. Para la prueba de relación de verosimilitud en identificación de distribución individual, la hipótesis nula es que los datos siguen la distribución más pequeña (parámetro más bajo). Por lo tanto, valores p para LRT más bajos proporcionan fuerte evidencia de que el ajuste de distribución mejora significativamente al utilizar un parámetro adicional.

Interpretación

Utilice el valor p para LRT para determinar si la adición del parámetro extra mejora significativamente el ajuste respecto a la distribución sin el parámetro extra.

Para cada distribución o transformación, compare el valor p para LRT con el nivel de significancia. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que el parámetro adicional mejora significativamente el ajuste de distribución, cuando en realidad no lo hace.
P ≤ α: La distribución más grande (parámetro más alto) proporciona un ajuste significativamente mejor. (Rechazar H0)
Si el valor p es menor que o igual al nivel de significancia, usted rechaza la hipótesis nula y concluye que el ajuste de distribución mejoró significativamente al usar un parámetro adicional.
P > α: No puede concluir que la distribución más grande (parámetro más alto) proporciona un ajuste significativamente mejor (No puede rechazar H0)
Si el valor p es mayor que el nivel de significancia, usted no puede rechazar la hipótesis nula. No hay suficiente evidencia para concluir que el ajuste de distribución mejoró significativamente al utilizar un parámetro adicional.

El valor p para LRT también es útil para distribuciones de 3 parámetros para las cuales no existe un método establecido para calcular el valor p. En estos casos, examine primero el valor p de la distribución de 2 parámetros correspondiente. Luego examine el valor p para LRT de la distribución de 3 parámetros para determinar si la distribución de 3 parámetros es significativamente mejor que la distribución de 2 parámetros.

En estos resultados, los valores p para LRT para las distribuciones lognormal de 3 parámetros (0.017), Weibull de 3 parámetros (0.000), gamma de 3 parámetros (0.006) y loglogística de 3 parámetros (0.027) sugieren que estas distribuciones mejoran significativamente el ajuste en comparación con sus contrapartes de 2 parámetros.

Identificación de la distribución para Calcio

Exponencial de 2 parámetros

* ADVERTENCIA * La matriz de varianzas y covarianzas de los parámetros estimados no existe. Se supone que el parámetro de valor umbral es fijo cuando se calculan intervalos de confianza. Gamma de 3 parámetros
* ADVERTENCIA * La matriz de varianzas y covarianzas de los parámetros estimados no existe. Se supone que el parámetro de valor umbral es fijo cuando se calculan intervalos de confianza. Gráfica de ID de distribución para Calcio

Gráfica de ID de distribución para Calcio

Gráfica de ID de distribución para Calcio

Gráfica de ID de distribución para Calcio

Estadísticas descriptivas N N* Media Desv.Est. Mediana Mínimo Máximo Asimetría Curtosis 50 0 50.782 2.76477 50.4 46.8 58.1 0.644923 -0.287071
transformación de Box-Cox: λ = -4 Función de Transformación de Johnson: 0.804604 + 0.893699 × Ln( ( X - 46.2931 ) / ( 59.8636 - X ) )
Prueba de bondad del ajuste Distribución AD P LRT P Normal 0.754 0.046 Transformación Box-Cox 0.414 0.324 Lognormal 0.650 0.085 Lognormal de 3 parámetros 0.341 * 0.017 Exponencial 20.614 <0.003 Exponencial de 2 parámetros 1.684 0.014 0.000 Weibull 1.442 <0.010 Weibull de 3 parámetros 0.230 >0.500 0.000 Valor extremo más pequeño 1.656 <0.010 Valor extremo por máximos 0.394 >0.250 Gamma 0.702 0.071 Gamma de 3 parámetros 0.268 * 0.006 Logística 0.726 0.034 Loglogística 0.659 0.050 Loglogística de 3 parámetros 0.432 * 0.027 Transformación de Johnson 0.124 0.986
Estimaciones ML de los parámetros de distribución Distribución Ubicación Forma Escala Valor umbral Normal* 50.78200 2.76477 Transformación de Box-Cox* 0.00000 0.00000 Lognormal* 3.92612 0.05368 Lognormal de 3 parámetros 1.69295 0.46849 44.74011 Exponencial 50.78200 Exponencial de 2 parámetros 4.06326 46.71873 Weibull 17.82470 52.13681 Weibull de 3 parámetros 1.47605 4.53647 46.66579 Valor extremo más pequeño 52.22257 2.95894 Valor extremo por máximos 49.50370 2.16992 Gamma 351.04421 0.14466 Gamma de 3 parámetros 2.99218 1.63698 45.88376 Logística 50.57182 1.59483 Loglogística 3.92259 0.03121 Loglogística de 3 parámetros 1.54860 0.32763 45.46180 Transformación de Johnson* 0.02897 0.97293 * Escala: Estimación de ML ajustado