Percentiles de distribución para Identificación de distribución individual

Encuentre definiciones y ayuda para interpretar cada uno de los estadísticos de percentiles de distribución que se proporcionan con Identificación de distribución individual.

Porcentajes y percentiles

Si usted elige estimar percentiles para porcentajes seleccionados de datos, Minitab muestra una tabla de percentiles. El percentil para el porcentaje P es el valor por debajo del cual puede esperar que se ubique el porcentaje P de los valores de la población para cada distribución. Por opción predeterminada, Minitab muestra los percentiles para 0,135%, 0,5%, 2% y 5%.

Interpretación

A veces puede ser difícil determinar la mejor distribución solo con base en la gráfica de probabilidad y las medidas de bondad de ajuste. En ese caso, usted puede comparar los percentiles de valores porcentuales seleccionados para cada distribución a fin de evaluar cómo afecta sus conclusiones utilizar diferentes distribuciones.
  • Si varias distribuciones proporcionan un ajuste razonable a los datos y sus valores percentiles están suficientemente cercanos, al punto que es posible que usted saque conclusiones similares utilizando cualquiera de las distribuciones, entonces probablemente no importa qué distribución elija.
  • Si los percentiles de las distribuciones con un ajuste razonable difieren en una cantidad que podría afectar los resultados de su análisis, convendría seleccionar la distribución que proporcione los resultados más conservadores para su aplicación.

Por ejemplo, supongamos que un proceso tiene un límite de especificación inferior de 46,2. En ese caso, la distribución de valor extremo más grande proporciona resultados levemente más conservadores cuando usted evalúa la capacidad del proceso en la cola inferior de la distribución. Si la diferencia es importante para la aplicación, podría utilizar la distribución de valor extremo más grande para evitar posibles sobreestimaciones de la capacidad del proceso.

Tabla de percentiles

DistribuciónPorcentajePercentilesError
estándar
IC de 95.0%
Normal144.35020.7568542.945.8
Transformación Box-Cox10.00000.000000.00.0
Lognormal144.75660.6576943.546.1
Lognormal de 3 parámetros146.56780.4449845.747.4
Exponencial10.51040.072180.40.7
Exponencial de 2 parámetros146.75960.0057846.746.8
Weibull140.27751.2089438.042.7
Weibull de 3 parámetros146.86680.1594546.747.2
Valor extremo más pequeño138.61101.5685235.541.7
Valor extremo por máximos146.18980.4125545.447.0
Gamma144.69020.6774043.446.0
Gamma de 3 parámetros146.59320.1934646.247.0
Logística143.24340.9150241.445.0
Loglogística143.78060.7849642.345.3
Loglogística de 3 parámetros146.50590.5930945.547.7
Transformación de Johnson1-2.23440.26634-2.8-1.7

En estos resultados, tanto la distribución de Weibull de 3 parámetros como la distribución de calor extremo más grande proporcionan un ajuste razonable para los datos con base en las gráficas de probabilidad y los valores p (no se muestran). Para la distribución de Weibull de 3 parámetros, usted puede esperar que 1% de los datos se ubiquen por debajo de 46,8668. Para la distribución de valor extremo más grande, puede esperar que 1% de los datos se ubiquen por debajo de 46,1898. Dependiendo del contexto, esta información adicional puede ayudar a seleccionar la mejor distribución. Si un valor provee estimaciones más conservadoras, puede seleccionar esa distribución.

Nota

Los valores para las transformaciones de Box-Cox y Johnson se basan más en los valores transformados que en los datos sin procesar, lo que hace que los percentiles sean difíciles de interpretar.

Error estándar del percentil

El error estándar del percentil estima la variabilidad entre los percentiles de las muestras que usted obtendría si tomara muestras repetidas de la misma población. Mientras que el error estándar de la media estima la variabilidad entre las muestras, la desviación estándar mide la variabilidad dentro de una misma muestra.

Interpretación

Utilice el error estándar del percentil para determinar el grado de precisión con que el percentil de la muestra estima el percentil de la población para cada distribución.

Un valor de error estándar más bajo indica una estimación más precisa del percentil de la población. Por lo general, una desviación estándar más grande se traducirá en un mayor error estándar y una estimación menos precisa del percentil de la población. Un tamaño de muestra más grande dará como resultado un menor error estándar y una estimación más precisa del percentil de la población.

Minitab usa el error estándar del percentil para calcular el intervalo de confianza, que es un rango de valores para el percentil de la población.

IC de percentiles

El intervalo de confianza proporciona un rango de valores probables para el percentil de una población. Un intervalo de confianza se define por un límite inferior y un límite superior. Los límites se calculan determinando un margen de error para la estimación del percentil de la muestra. El borde de confianza inferior define un valor en comparación con el cual es probable que el percentil sea mayor. El borde de confianza superior define un valor en comparación con el cual es probable que el percentil sea menor.

Interpretación

Puesto que las muestras de datos son aleatorias, es improbable que dos muestras recolectadas del proceso produzcan estimaciones idénticas de un percentil. Para calcular el valor real del percentil del proceso, usted tendría que analizar los datos de todos los elementos que produce el proceso, lo cual no es factible. En lugar de ello, puede utilizar un intervalo de confianza para determinar un rango de valores probables para el percentil.

En un nivel de confianza de 95%, usted puede estar 95% seguro de que el valor real del percentil se encuentra dentro del intervalo de confianza. Es decir, si recolecta 100 muestras aleatorias del proceso, puede esperar que aproximadamente 95 de las muestras produzcan intervalos que contengan el valor real del percentil.

La amplitud de un intervalo de confianza tiende a disminuir con tamaños de muestra más grandes o menos variabilidad en los datos. Un intervalo de confianza estrecho indica que la estimación de la muestra es fiable y no es probable que variabilidad ocasionada por muestreo aleatorio influya marcadamente en ella. Si el intervalo de confianza de un percentil es ancho, sea precavido al utilizar la estimación de punto percentil para sacar conclusiones sobre el proceso. Si el intervalo de confianza es ancho, convendría que base su estimación del valor percentil en el borde inferior o el borde superior del intervalo de confianza, el que produzca los resultados más conservadores para su aplicación.

Tabla de percentiles

DistribuciónPorcentajePercentilesError
estándar
IC de 95.0%
Normal144.35020.7568542.945.8
Transformación Box-Cox10.00000.000000.00.0
Lognormal144.75660.6576943.546.1
Lognormal de 3 parámetros146.56780.4449845.747.4
Exponencial10.51040.072180.40.7
Exponencial de 2 parámetros146.75960.0057846.746.8
Weibull140.27751.2089438.042.7
Weibull de 3 parámetros146.86680.1594546.747.2
Valor extremo más pequeño138.61101.5685235.541.7
Valor extremo por máximos146.18980.4125545.447.0
Gamma144.69020.6774043.446.0
Gamma de 3 parámetros146.59320.1934646.247.0
Logística143.24340.9150241.445.0
Loglogística143.78060.7849642.345.3
Loglogística de 3 parámetros146.50590.5930945.547.7
Transformación de Johnson1-2.23440.26634-2.8-1.7

En estos resultados, utilizando la distribución de valor extremo más grande, usted puede esperar que 1% de los datos se ubiquen por debajo del valor 46,1898 con base en la estimación de la muestra. El intervalo de confianza de 95% es (45,4, 47). Supongamos que el límite de especificación inferior de un proceso es 47. Para ser cauteloso, convendría utilizar el borde inferior (45,4) del intervalo de confianza de la estimación del percentil. Usando el borde inferior, puede esperar que 1% de los datos se ubiquen por debajo del valor 45,4, lo que proporciona una estimación más conservadora en esta situación.

Nota

Los valores para las transformaciones de Box-Cox y Johnson se basan más en los valores transformados que en los datos sin procesar, lo que hace que los percentiles sean difíciles de interpretar.