Use o gráfico de probabilidade normal para avaliar o quanto seus dados se aproximam de cada distribuição.
Se a distribuição for um bom ajuste para os dados, os pontos devem cair próximos à linha de distribuição ajustada. Pontos distantes da linha reta indicam que o ajuste é inaceitável.
Além do gráfico de probabilidade, use as medidas de qualidade do ajuste, como os valores de p de AD e os valores de p de LRT para avaliar o ajuste de distribuição.
A estatística do teste de qualidade de ajuste de Anderson-Darling (AD) é uma medida dos desvios entre a linha ajustada (com base na distribuição selecionada) e a função da etapa não paramétrica (com base nos pontos de dados). A estatística Anderson-Darling é uma distância ao quadrado que é ponderada mais pesadamente nas caudas da distribuição.
O Minitab usa a estatística de Anderson-Darling para calcular o valor de p. O valor de p é uma probabilidade que mede a evidência contra a hipótese nula de que os dados seguem a distribuição.
Geralmente, os valores substancialmente menores para a estatística de Anderson-Darling indicam que os dados seguem uma distribuição mais de próxima. No entanto, evite comparar diretamente os valores de AD em diferentes distribuições quando os valores de AD estão próximos, porque as estatísticas AD são distribuídos de forma diferente para diferentes distribuições. Para comparar melhor o ajuste de diferentes distribuições, use critérios adicionais, como gráficos de probabilidade, valores de p e seu conhecimento do processo.
Nenhum valor de p para o teste do AD está disponível para as distribuições para 3 parâmetros, com exceção para a distribuição Weibull.
Use o valor de p para avaliar o ajuste da distribuição.
Tenha cuidado ao interpretar os resultados a partir de uma amostra muito pequena ou muito grande. Se você tem uma amostra muito pequena, um teste de qualidade de ajuste pode não ter poder suficiente para detectar desvios significativos da distribuição. Se você tem uma amostra muito grande, o teste pode ser tão poderosa a ponto de detectar até mesmo pequenos desvios da distribuição que não têm nenhuma significância prática. Além dos gráficos de probabilidade, utilize os valores de p para avaliar o ajuste de distribuição.
Distribuição | AD | P | TRV P |
---|---|---|---|
Normal | 0,754 | 0,046 | |
Transformação de Box-Cox | 0,414 | 0,324 | |
Lognormal | 0,650 | 0,085 | |
Lognormal de 3 Parâmetros | 0,341 | * | 0,017 |
Exponencial | 20,614 | <0,003 | |
Exponencial de 2 Parâmetros | 1,684 | 0,014 | 0,000 |
Weibull | 1,442 | <0,010 | |
Weibull de 3 Parâmetros | 0,230 | >0,500 | 0,000 |
Menor Valor Extremo | 1,656 | <0,010 | |
Maior Valor Extremo | 0,394 | >0,250 | |
Gama | 0,702 | 0,071 | |
Gama de 3 Parâmetros | 0,268 | * | 0,006 |
Logística | 0,726 | 0,034 | |
Loglogística | 0,659 | 0,050 | |
Loglogística de 3 Parâmetros | 0,432 | * | 0,027 |
Transformação de Johnson | 0,124 | 0,986 |
Nestes resultados, várias distribuições têm um valor de p que é maior do que 0,05. A distribuição Weibull para 3 parâmetros (P > 0,50) e a distribuição de maior valor extremo (P > 0,25) têm os maiores valores de p, e parecem ajustar os dados de amostra melhor do que as outras distribuições. Além disso, a transformação de Box-Cox (P = 0,324) e a transformação Johnson (P = 0,986) são eficazes na transformação dos dados para seguir uma distribuição normal.
Para várias distribuições, o Minitab também exibe resultados para a distribuição de um parâmetro adicional. Por exemplo, para a distribuição lognormal, o Minitab exibe resultados para ambas as versões de 2 parâmetros e de 3 parâmetros da distribuição. Para distribuições que tenham parâmetros adicionais, use o valor de p do teste da razão de verossimilhança (LRT P) para determinar se a adição de outro parâmetro melhora significativamente o ajuste da distribuição. Um valor de p de LRT que seja inferior a 0,05 indica que a melhoria no ajuste é significativa. Para obter mais informações, consulte a seção sobre LRT P.
Para várias distribuições, o Minitab também exibe resultados para a distribuição de um parâmetro adicional. Para cada versão de parâmetro extra de uma distribuição, o Minitab relata um valor de p para o teste da razão de verossimilhança (LRT P). O valor de p é uma probabilidade que mede a evidência contra a hipótese nula. Para o teste da razão de verossimilhança na identificação da distribuição individual, a hipótese nula é que os dados seguem a menor (parâmetro inferior) distribuição. Portanto, os valores de p do LRT mais baixo fornecem evidências mais fortes de que o ajuste de distribuição sejam significativamente melhorados através da utilização de um parâmetro adicional.
Use o valor de p do LRT para determinar se a adição do parâmetro extra melhora significativamente o ajuste sobre a distribuição sem o parâmetro extra.
O LRT do valor de p também é útil para distribuições para 3 parâmetros para as quais não exista nenhum método estabelecido para o cálculo do valor de p. Nestes casos, primeiro examine o valor de p para a distribuição para dois parâmetros correspondente. Em seguida, examine o valor de p de LRT para a distribuição para 3 parâmetros para determinar se a distribuição para 3 parâmetros é significativamente melhor do que a distribuição para dois parâmetros.
Nestes resultados, os valores de p de LRT para as distribuições lognormais para 3 parâmetros (0,017), Weibull para 3 parâmetros (0,000), gama para 3 parâmetros (0,006), e loglogísticas para 3 parâmetros (0,027) sugerem que estas distribuições melhoram significativamente o ajuste em comparação com suas contrapartes de 2 parâmetros.
Distribuição | AD | P | TRV P |
---|---|---|---|
Normal | 0,754 | 0,046 | |
Transformação de Box-Cox | 0,414 | 0,324 | |
Lognormal | 0,650 | 0,085 | |
Lognormal de 3 Parâmetros | 0,341 | * | 0,017 |
Exponencial | 20,614 | <0,003 | |
Exponencial de 2 Parâmetros | 1,684 | 0,014 | 0,000 |
Weibull | 1,442 | <0,010 | |
Weibull de 3 Parâmetros | 0,230 | >0,500 | 0,000 |
Menor Valor Extremo | 1,656 | <0,010 | |
Maior Valor Extremo | 0,394 | >0,250 | |
Gama | 0,702 | 0,071 | |
Gama de 3 Parâmetros | 0,268 | * | 0,006 |
Logística | 0,726 | 0,034 | |
Loglogística | 0,659 | 0,050 | |
Loglogística de 3 Parâmetros | 0,432 | * | 0,027 |
Transformação de Johnson | 0,124 | 0,986 |