Análises disponíveis para dados não normais

A seleção de um método apropriado é um primeiro passo essencial na realização de uma análise de capacidade. Se o método não se ajustar bem aos dados, as estimativas de capacidade serão imprecisas. Se você tiver dados não normais, há várias maneiras de executar uma análise de capacidade:
  • Selecione um modelo de distribuição não normal que ajusta seus dados e, em seguida, analisar os dados usando uma análise de capacidade para dados não normais, como Análise de capacidade não normal.
  • Transforme os dados para que a distribuição normal seja um modelo apropriado, e use uma análise de capacidade para dados normais, como Análise de capacidade normal.
  • Selecione um método não paramétrico que não faça suposições sobre a distribuição dos dados, como Análise de Capacidade (Não Paramétrica).
Para selecionar um método, você geralmente considera pelo menos os seguintes critérios:
Use o conhecimento de engenharia ou o histórico do seu processo.
Muito frequentemente, é melhor usar o conhecimento de engenharia e o histórico do seu processo para identificar uma método que se ajusta aos dados do seu processo. Por exemplo, os dados seguem uma distribuição simétrica? Que método funcionou no passado para situações semelhantes?
Use avaliações de qualidade de ajuste.
O teste de Anderson-Darling avalia se uma determinada distribuição se ajusta aos dados de um processo. Os gráficos de probabilidade são outra ferramenta que avalia o quanto os dados seguem uma distribuição.
Avalie como diferentes métodos afetam suas conclusões.
Se vários métodos fornecem um ajuste adequado aos dados e conclusões semelhantes, então a escolha é menos consequente. Por outro lado, se suas conclusões dependem do método, você pode querer relatar a conclusão mais conservadora ou coletar mais informações. Por exemplo, você pode usar os resultados da distribuição de Análise Automatizada de Capacidade ou os percentis de Identificação de distribuição individual para ver como suas conclusões dependem do método.
Se vários métodos fornecerem um ajuste adequado e conclusões semelhantes, você também pode considerar critérios adicionais:
  • Se você planeja executar repetidas análises de capacidade em seu processo ao longo do tempo, tente usar um método que provavelmente caracterize adequadamente seu processo consistentemente ao longo do tempo. O uso do mesmo método permite comparar fácil e diretamente os índices das análises repetidas.
  • Os modelos não normais e não paramétricos usam as unidades de dados reais. O modelo normal de uma transformação usa unidades transformadas.
  • O modelo normal de uma transformação fornece estimativas da capacidade geral e dentro do processo.

Use Análise Automatizada de Capacidade para que o Minitab Statistical Software ajude a determinar um método razoável que se ajuste aos dados, considerando a utilidade e a praticidade do método. A análise considera primeiro distribuições e depois transformações. Se nenhum modelo se ajustar aos dados, a análise usará o método não paramétrico.

Para ver mais detalhes sobre os dados, use Identificação de distribuição individual. A análise fornece medidas de qualidade de ajuste para diferentes métodos para apoiar sua decisão sobre qual método usar.

Usar Análise Automatizada de Capacidade para selecionar um método

Use Análise Automatizada de Capacidade para avaliar a compatibilidade de vários métodos com os dados e fazer uma seleção razoável.

  1. Escolha Estat > Ferramentas da Qualidade > Análise de capacidade > Automatizado.
  2. Especifique se seus dados estão organizados em uma única coluna ou entre linhas.
  3. Insira os limites de especificação para o processo.

A análise considera distribuições e, em seguida, transformações. Se nenhum método paramétrico se ajustar aos dados, a análise usará o método não paramétrico. Os resultados incluem um relatório de capacidade para o primeiro método que fornece um ajuste razoável. A tabela de resultados da distribuição mostra a ordem da avaliação dos métodos, informações sobre o ajuste dos métodos e estatísticas de capacidade. Você pode produzir resultados para um método alternativo para investigar os métodos em mais detalhes.

Exemplo de uso Análise Automatizada de Capacidade para selecionar um método

Um engenheiro coleta dados sobre a extensão do empenamento em revestimentos cerâmicos. A distribuição dos dados é desconhecida, então ela executa Identificação de distribuição individual os dados para determinar um método razoável para uma análise de capacidade.

A tabela de distribuição dos resultados mostra a ordem de avaliação dos métodos. Na primeira linha, a conclusão para o teste de Anderson-Darling é que os dados não seguem uma distribuição normal ao nível de significância de 0,05, pois o valor de p é menor que 0,05. Na segunda linha, a conclusão para o teste de Anderson-Darling é que a distribuição de Weibull é um ajuste razoável aos dados, pois o valor de p é maior que 0,05. Os resultados de capacidade são para a distribuição Weibull porque a distribuição Weibull é o primeiro método na lista que fornece um ajuste razoável.

Os engenheiros usam o conhecimento do processo para considerar se a distribuição Weibull é um método razoável. Por exemplo, a distribuição Weibull tem um limite em 0. Nos dados, 0 é um limite que representa um bloco não distorcido.

A análise inclui uma análise de capacidade que usa a distribuição Weibull.

Resultados da distribuição automatizada de capacidades: Deformação

DistribuiçãoLocalEscalaLimiteFormaPPpkCpk
Normal2,92311,7860    0,01004210,57430,5838
Weibull*  3,2781  1,6937>0,250,5133 
Lognormal0,84430,7444    <0,0050,4242 
Menor Valor Extremo3,86411,9924    <0,010,5362 
Maior Valor Extremo2,09581,4196    0,2128350,5130 
Gama  1,2477  2,34280,2383370,4851 
Logística2,79591,0162    0,01273470,5799 
Loglogística0,90970,4217    <0,0050,4090 
Exponencial  2,9231    <0,00250,3780 
Weibull de 3 Parâmetros  2,99690,20991,50490,4670970,4980 
Lognormal de 3 Parâmetros1,37880,4184-1,4002    0,4961 
Gama de 3 Parâmetros  1,2314-0,01972,3898  0,4864 
Loglogística de 3 Parâmetros1,30430,2700-1,0940    0,4656 
Exponencial de 2 Parâmetros  2,66790,2552  <0,010,3982 
Transformação de Box-Cox1,62370,5380    0,5743370,51160,5214
Transformação de Johnson0,01120,9949    0,7988950,4959 
Não-paramétrico          0,6187 
*indica a distribuição selecionada
A estatística de capacidade é Cnpk para o caso não paramétrico.

Use Identificação de distribuição individual para encontrar uma distribuição ou transformação apropriada

Use Identificação de distribuição individual antes de realizar uma análise de capacidade para determinar qual distribuição ou transformação é a mais apropriada para seus dados. Se nenhuma distribuição ou transformação for compatível com seus dados, considere o Análise de Capacidade (Não Paramétrica).

  1. Escolha Estat > Ferramentas da Qualidade > Identificação de distribuição individual.
  2. Selecione se seus dados são organizados em uma única coluna ou entre linhas.
  3. Escolha Usar todas as distribuições e transformações ou Especificar e escolha até 4 distribuições e transformações para testar.
Se uma distribuição não-normal fornecer o melhor ajuste, use um dos seguintes modelos de capacidade não-normal para avaliar seu processo:
  • Análise de capacidade não normal
  • Análise de capacidade não normal para múltiplas variáveis
  • Capability Sixpack não normal
Quando você configurar a análise, indique o tipo de distribuição não-normal que forneceu o melhor ajuste para seus dados.
Se uma transformação for mais eficiente para seus dados, use um dos seguintes modelos de capacidade normal para avaliar seu processo:
  • Análise de capacidade normal
  • Capability Sixpack normal
  • Análise de capacidade normal para múltiplas variáveis
  • Análise de capacidade entre/dentro
Ao configurar uma análise de capacidade normal, clique Transformar e indique se deseja usar a transformação Johnson ou Box-Cox para fazer com que seus dados sigam uma distribuição normal. Ao configurar uma análise de capacidade entre/dentro, clique Box-Cox e use a transformação Box-Cox para fazer com que seus dados sigam uma distribuição normal

Exemplo de uso de Identificação de distribuição individual para comparar acessos de distribuições e transformações

Um engenheiro coleta dados sobre a extensão do empenamento em revestimentos cerâmicos. A distribuição dos dados é desconhecida, portanto, ela realiza Identificação de distribuição individual nos dados para comparar qualidade do ajuste entre a distribuição exponencial e a distribuição normal após uma transformação de Johnson.

Distribuição exponencial

Este gráfico de probabilidades indica que a distribuição exponencial não é um bom ajuste; o valor-p é baixo o bastante para rejeitar a hipótese nula de que os dados seguem uma distribuição exponencial.

Distribuição normal com a transformação de Johnson

Contudo, depois de aplicar uma transformação de Johnson, os dados seguem de perto uma distribuição normal porque o valor-p é grande, e quase todos os pontos de dados se encaixam dentro dos limites de confiança do gráfico de probabilidade normal.

Dessas duas distribuições, a distribuição normal com uma transformação de Johnson fornece o melhor ajuste para os dados. Por isso a análise apropriada é uma análise de capacidade normal com uma transformação de Johnson.