Qué debe considerarse cuando se evalúa el ajuste de la distribución
La selección de una distribución apropiada es un primer paso esencial para realizar un análisis de fiabilidad. Si la distribución seleccionada no se ajusta adecuadamente a los datos, entonces las estimaciones de fiabilidad serán inexactas. También se necesita un modelo de distribución de ajuste adecuado para extrapolar más allá del rango de datos. Al momento de elegir la distribución más apropiada para sus datos de fiabilidad, considere los siguientes criterios:
Utilice el conocimiento histórico y de ingeniería con respecto a la situación. Por ejemplo, ¿siguen los datos una distribución simétrica? ¿Es la función de riesgo constante, creciente o decreciente? ¿Qué distribución ha funcionado en el pasado en situaciones similares?
Realice un análisis de distribución y use gráficas de probabilidad para comparar las distribuciones candidatas o para evaluar la conveniencia de la distribución elegida.
Evalúe el estadístico de bondad de ajuste de Anderson-Darling y el coeficiente de correlación de Pearson:
Valores de Anderson-Darling sustancialmente más bajos por lo general indican una distribución de mejor ajuste. El estadístico Anderson-Darling se calcula tanto para el método de estimación de máxima verosimilitud (MLE) como para el método de estimación de mínimos cuadrados (LSE).
Valores sustancialmente más altos del coeficiente de correlación de Pearson identifican una distribución de mejor ajuste. El coeficiente de correlación está disponible para el método LSE.
Evalúe la manera en que las diferentes distribuciones afectan sus conclusiones:
Si varias distribuciones proveen un ajuste adecuado a los datos y dan como resultado conclusiones similares, entonces es probable que no importe cuál distribución se elija.
Si las conclusiones difieren dependiendo de la distribución elegida, se recomienda comunicar la conclusión más conservadora o recopilar más información.
Distribuciones que puede usar para modelar datos asimétricos o datos simétricos
Con frecuencia, se puede modelar un conjunto de datos con más de una distribución o con una distribución que tiene uno, dos o tres parámetros. Por ejemplo, para cada tipo de datos, varias distribuciones pueden ser adecuadas:
Datos asimétricos hacia la derecha
Con frecuencia, se puede ajustar la distribución de Weibull o la distribución lognormal y obtener un ajuste adecuado a los datos.
Datos simétricos
Con frecuencia, se puede ajustar la distribución de Weibull o la distribución lognormal. A veces, se puede ajustar la distribución normal (dependiendo de lo pesado de las colas) y obtener resultados similares.
Datos asimétricos hacia la izquierda
Con frecuencia, se puede ajustar la distribución de Weibull o la distribución de valor extremo más pequeño.
A veces, un conjunto particular de datos se puede modelar utilizando 2 ó 3 parámetros. Un modelo de 3 parámetros puede ofrecer un mejor ajuste para algunos datos, pero también puede provocar un ajuste excesivo del modelo. Un ajuste excesivo significa que el modelo se ajusta adecuadamente a los datos de la muestra, pero no se ajustaría a otra muestra de la misma población. Por lo general, los expertos recomiendan elegir el modelo más simple que funcione.
Para obtener más información sobre distribuciones específicas que se utilizan para modelar datos de fiabilidad, vaya a los siguientes temas: