La selección de una distribución adecuada es un primer paso esencial para llevar a cabo un análisis de capacidad. Si la distribución elegida no se ajusta a los datos de manera adecuada, entonces las estimaciones de capacidad serán inexactas.
En la mayoría de los casos, lo mejor es utilizar los conocimientos de ingeniería e históricos del proceso para identificar una distribución que se ajuste a los datos del proceso. Por ejemplo, ¿siguen los datos una distribución simétrica? ¿Qué distribución ha funcionado en el pasado en situaciones similares?
A veces puede ser difícil determinar la mejor distribución con base en la gráfica de probabilidad y las medidas de bondad de ajuste. Utilice la Tabla de percentiles de Identificación de distribución individual para varias distribuciones seleccionadas para ver cómo cambian sus conclusiones dependiendo de la distribución elegida.
Si varias distribuciones proveen un ajuste adecuado a los datos y también proveen conclusiones similares, entonces es probable que no importe cuál distribución elija usted. Por el contrario, si las conclusiones difieren dependiendo de la distribución elegida, se recomienda que incluya en el informe la conclusión más conservadora o que recolecte más información.
Utilice Identificación de distribución individual antes de realizar un análisis de capacidad para determinar qué distribución o transformación es la más adecuada para sus datos.
Por ejemplo, una ingeniera recopila datos sobre el grado de deformación en unas losetas. La distribución de los datos es desconocida, de modo que ella realiza la Identificación de distribución individual con los datos para comparar la bondad de ajuste entre la distribución exponencial y la distribución normal después de una transformación de Johnson.
Esta gráfica de probabilidad indica que la distribución exponencial no es un buen ajuste; el valor p es lo suficientemente bajo como para rechazar la hipótesis nula de que los datos siguen una distribución exponencial.
Sin embargo, después de aplicar una transformación de Johnson, los datos siguen de cerca una distribución normal, porque el valor p es grande y casi todos los puntos de los datos se encuentran dentro de los límites de confianza de la gráfica de probabilidad normal.