O que deve ser considerado ao avaliar um ajuste de distribuição

Selecionar uma distribuição adequada é um passo inicial essencial na realização de análises de confiabilidade. Se a distribuição selecionada não ajustar bem os dados, as estimativas de confiabilidade serão imprecisas. Um modelo de distribuição bem ajustado também é necessário para se extrapolar além do intervalo de dados. Considere os critérios a seguir ao escolher a distribuição mais adequada para os dados de confiabilidade:
  • Use o conhecimento de engenharia ou o histórico da situação. Por exemplo, os dados seguem uma distribuição simétrica? O risco é constante, crescente ou decrescente? Qual distribuição funcionou historicamente para situações semelhantes?
  • Realize uma análise de distribuição e use gráficos de probabilidade para comparar as distribuições candidatas ou para avaliar a adequação da distribuição escolhida.
  • Avalie a estatística de qualidade de ajuste de Anderson-Darling e o coeficiente de correlação de Pearson:
    • Valores de Anderson-Darling substancialmente em geral indicam uma distribuição com melhor ajuste. A estatística de Anderson-Darling é calculada para os métodos de estimativa máxima verossimilhança (MLE) e mínimos quadrados (LSE).
    • Valores do coeficiente de correlação de Pearson substancialmente maiores identificam uma distribuição com melhor ajuste. O coeficiente de correlação está disponível para o método LSE.
  • Avalie como diferentes distribuições afetam suas conclusões;
    • Se várias distribuições fornecerem um ajuste adequado para os dados e resultam em conclusões semelhantes, então, provavelmente, não faz diferença qual é a distribuição escolhida.
    • Se as conclusões dependem da distribuição que você escolher, pode ser interessante usar a conclusão mais conservadora ou coletar mais informações.

Distribuições que podem ser usadas para modelar dados com dados assimétricos ou simétricos

Muitas vezes, é possível modelar um conjunto de dados com mais de uma distribuição ou com uma distribuição que tem um, dois, ou três parâmetros. Por exemplo, diversas distribuições podem se ajustar a cada tipo de dado:
Dados com assimetria para a direita
Muitas vezes, é possível ajustar tanto a distribuição Weibull quanto a distribuição lognormal e obter um bom ajuste para os dados.
Dados simétricos
Muitas vezes, é possível ajustar a distribuição Weibull ou lognormal. Às vezes, é possível ajustar a distribuição normal (dependendo do peso das caudas) e obter resultados semelhantes.
Dados com assimetria para a esquerda
Frequentemente, é possível ajustar a distribuição de Weibull ou a distribuição do menor valor extremo.
Um conjunto particular de dados pode, às vezes, ser modelado usando 2 ou 3 parâmetros. Um modelo com 3 parâmetros pode proporcionar um melhor ajuste para alguns dados, mas também pode resultar em sobreajuste do modelo. Sobreajuste significa que o modelo ajusta os dados de amostra bem, mas não ajustaria outra amostra da mesma população. Normalmente, os especialistas aconselham escolher o modelo mais simples que funciona.