Análisis disponibles para datos no normales

La selección de un método apropiado es un primer paso esencial para realizar un análisis de capacidad. Si el método no se ajusta bien a los datos, entonces las estimaciones de capacidad son inexactas. Si tiene datos no normales, hay varias formas de realizar un análisis de capacidad:
  • Seleccione un modelo de distribución no normal que se ajuste a los datos y luego analice los datos utilizando un análisis de capacidad para datos no normales, como el Análisis de capacidad no normal.
  • Transforme los datos de manera que la distribución normal sea un modelo apropiado y utilice un análisis de capacidad para datos normales, como el Análisis de capacidad normal.
  • Seleccione un método no paramétrico que no haga suposiciones sobre la distribución de los datos, como Análisis de capacidad (no paramétrico).
Para seleccionar un método, normalmente se tienen en cuenta al menos los siguientes criterios:
Utilice los conocimientos de ingeniería o históricos del proceso.
En la mayoría de los casos, lo mejor es utilizar los conocimientos de ingeniería e históricos del proceso para identificar un método que se ajuste a los datos del proceso. Por ejemplo, ¿siguen los datos una distribución simétrica? ¿Qué método ha funcionado en el pasado para situaciones similares?
Utilice evaluaciones de bondad de ajuste.
La prueba de Anderson-Darling evalúa si una distribución dada se ajusta a los datos de un proceso. Los gráficos de probabilidad son otra herramienta que evalúa qué tan cerca siguen los datos a una distribución.
Evalúe cómo los diferentes métodos afectan sus conclusiones.
Si varios métodos proporcionan un ajuste adecuado a los datos y conclusiones similares, entonces la elección es menos importante. Por el contrario, si sus conclusiones dependen del método, es posible que desee informar la conclusión más conservadora o recopilar más información. Por ejemplo, puede usar los resultados de distribución de Análisis automático de capacidad o los percentiles de Identificación de distribución individual para ver cómo sus conclusiones dependen del método.
Si varios métodos proporcionan un ajuste adecuado y conclusiones similares, también puede considerar criterios adicionales:
  • Si planea realizar análisis de capacidad repetidos en su proceso a lo largo del tiempo, intente usar un método que probablemente caracterice adecuadamente su proceso de manera consistente a lo largo del tiempo. El uso del mismo método le permite comparar fácil y directamente los índices de los análisis de repetición.
  • Los modelos no normales y no paramétricos utilizan las unidades de datos reales. El modelo normal de una transformación utiliza unidades transformadas.
  • El modelo normal de una transformación proporciona estimaciones de la capacidad general y dentro del proceso.

Utilice Análisis automático de capacidad para que Minitab Statistical Software ayude a determinar un método razonable que se ajuste a los datos, teniendo en cuenta la utilidad y practicidad del método. El análisis considera primero las distribuciones, luego las transformaciones. Si ningún modelo se ajusta a los datos, el análisis utiliza el método no paramétrico.

Para ver más detalles sobre los datos, utilice Identificación de distribución individual. El análisis proporciona medidas de bondad de ajuste para diferentes métodos para respaldar su decisión sobre qué método usar.

Usar Análisis automático de capacidad para seleccionar un método

Se utiliza Análisis automático de capacidad para evaluar la compatibilidad de varios métodos con los datos y hacer una selección razonable.

  1. Elija Estadísticas > Herramientas de calidad > Análisis de capacidad > Automatizado.
  2. Especifique si los datos están organizados en una sola columna o en filas.
  3. Introduzca los límites de especificación para el proceso.

El análisis considera distribuciones, luego transformaciones. Si ningún método paramétrico se ajusta a los datos, el análisis utiliza el método no paramétrico. Los resultados incluyen un informe de capacidad para el primer método que proporciona un ajuste razonable. La tabla de resultados de distribución muestra el orden de la evaluación de los métodos, información sobre el ajuste de los métodos y estadísticas de capacidad. Puede producir resultados para un método alternativo para investigar los métodos con más detalle.

Ejemplo de uso Análisis automático de capacidad para seleccionar un método

Un ingeniero recopila datos sobre el alcance de la deformación en baldosas cerámicas. La distribución de datos es desconocida, por lo que realiza Identificación de distribución individual los datos para determinar un método razonable para un análisis de capacidad.

La tabla de resultados de distribución muestra el orden de la evaluación de los métodos. En la primera fila, la conclusión de la prueba de Anderson-Darling es que los datos no siguen una distribución normal en el nivel de significación de 0,05 porque el valor p es menor que 0,05. En la segunda fila, la conclusión para la prueba de Anderson-Darling es que la distribución de Weibull es un ajuste razonable a los datos porque el valor p es mayor que 0.05. Los resultados de la capacidad son para la distribución de Weibull porque la distribución de Weibull es el primer método de la lista que proporciona un ajuste razonable.

Los ingenieros utilizan el conocimiento del proceso para considerar si la distribución de Weibull es un método razonable. Por ejemplo, la distribución de Weibull tiene un límite en 0. En los datos, 0 es un límite que representa un mosaico sin deformar.

El análisis incluye un análisis de capacidad que utiliza la distribución de Weibull.

Resultados automatizados de distribución de capacidades: Deformación

DistribuciónUbicaciónEscalaValor umbralFormaPPpk
Normal2.92311.7860    0.01004210.5743
Weibull*  3.2781  1.6937>0.250.5133
Lognormal0.84430.7444    <0.0050.4242
Valor extremo más pequeño3.86411.9924    <0.010.5362
Valor extremo por máximos2.09581.4196    0.2128350.5130
Gamma  1.2477  2.34280.2383370.4851
Logística2.79591.0162    0.01273470.5799
Loglogística0.90970.4217    <0.0050.4090
Exponencial  2.9231    <0.00250.3780
Weibull de 3 parámetros  2.99690.20991.50490.4670970.4980
Lognormal de 3 parámetros1.37880.4184-1.4002    0.4961
Gamma de 3 parámetros  1.2314-0.01972.3898  0.4864
Loglogística de 3 parámetros1.30430.2700-1.0940    0.4656
Exponencial de 2 parámetros  2.66790.2552  <0.010.3982
transformación de Box-Cox1.62370.5380    0.5743370.5116
Transformación de Johnson0.01120.9949    0.7988950.4959
No paramétrico          0.6187
DistribuciónCpk
Normal0.5838
Weibull* 
Lognormal 
Valor extremo más pequeño 
Valor extremo por máximos 
Gamma 
Logística 
Loglogística 
Exponencial 
Weibull de 3 parámetros 
Lognormal de 3 parámetros 
Gamma de 3 parámetros 
Loglogística de 3 parámetros 
Exponencial de 2 parámetros 
transformación de Box-Cox0.5214
Transformación de Johnson 
No paramétrico 
*indica la distribución seleccionada
El estadístico de capacidad es Cnpk para el caso no paramétrico.

Usar Identificación de distribución individual para encontrar una distribución o transformación adecuada

Utilice Identificación de distribución individual antes de realizar un análisis de capacidad para determinar qué distribución o transformación es la más adecuada para sus datos. Si ninguna distribución o transformación es compatible con sus datos, considere Análisis de capacidad (no paramétrico).

  1. Elija Estadísticas > Herramientas de calidad > Identificación de distribución individual.
  2. Elija si los datos están ordenados en una sola columna o en filas.
  3. Elija Usar todas las distribuciones y transformaciones o Especificar y elija hasta 4 distribuciones y transformaciones para probar.
Si una distribución no normal provee el mejor ajuste, utilice uno de los siguientes modelos de capacidad no normal para evaluar el proceso:
  • Análisis de capacidad no normal
  • Análisis de capacidad no normal para múltiples variables
  • Análisis de capacidad Seis en uno no normal
Cuando configure el análisis, indique el tipo de distribución no normal que se ajustó mejor a los datos.
Si una transformación es la más efectiva para los datos, utilice uno de los siguientes modelos de capacidad normal para evaluar el proceso:
  • Análisis de capacidad normal
  • Análisis de capacidad Seis en uno normal
  • Análisis de capacidad normal para múltiples variables
  • Análisis de capacidad de subgrupos/corto plazo
Cuando configure un análisis de capacidad normal, haga clic e Transformar indique si desea utilizar la transformación Johnson o la transformación Box-Cox para que los datos sigan una distribución normal. Cuando configure un análisis de capacidad entre/dentro, haga clic Box-Cox y use la transformación de Box-Cox para hacer que sus datos sigan una distribución normal.

Ejemplo de cómo usar Identificación de distribución individual para comparar los ajustes de las distribuciones y transformaciones

Un ingeniero recopila datos sobre el alcance de la deformación en baldosas cerámicas. La distribución de los datos es desconocida, de modo que ella realiza la Identificación de distribución individual con los datos para comparar la bondad de ajuste entre la distribución exponencial y la distribución normal después de una transformación de Johnson.

Distribución exponencial

Esta gráfica de probabilidad indica que la distribución exponencial no es un buen ajuste; el valor p es lo suficientemente bajo como para rechazar la hipótesis nula de que los datos siguen una distribución exponencial.

Distribución normal con transformación de Johnson

Sin embargo, después de aplicar una transformación de Johnson, los datos siguen de cerca una distribución normal, porque el valor p es grande y casi todos los puntos de los datos se encuentran dentro de los límites de confianza de la gráfica de probabilidad normal.

De estas dos distribuciones, la distribución normal con una transformación de Johnson ofrece el mejor ajuste para los datos. Por lo tanto, el análisis apropiado es un análisis de capacidad normal con una transformación de Johnson.