Métodos para Identificação de distribuição individual

Estimativas de máxima verossimilhança

As estimativas de máxima verossimilhança dos parâmetros na distribuição são calculadas através da maximização da função de probabilidade relacionada aos parâmetros. Para um determinado conjunto de dados, a função de probabilidade de uma distribuição calcula a probabilidade de gerar os dados sob essa distribuição.

O algoritmo de Newton-Raphson é utilizado para calcular estimativas de máxima verossimilhança dos parâmetros, os quais definem a distribuição. O algoritmo de Newton-Raphson é um método recursivo para calcular o máximo de uma função. 1 Os percentis são calculados a partir dessa distribuição.

Observação

O Minitab calcula as estimativas dos parâmetros usando o método de máxima verossimilhança para todas as distribuições, exceto distribuições normais e lognormais. Para a distribuição normal e a distribuição lognormal, o Minitab calcula as estimativas não viciadas dos parâmetros.

Teste de qualidade de ajuste

O Minitab usa estatísticas de Anderson-Darling para realizar o teste de qualidade do ajuste.

Seja Z = F(X), onde F(X) é a função de distribuição acumulada. Suponha que uma amostra X1, .., Xn fornece valores Z(i) = F(Xi), i=1,.., n. Reorganize Z(i) em ordem crescente, Z(1) < Z(2) <...<Z(n). Em seguida, a estatística de Anderson-Darling (A2) é calculada da seguinte maneira:

  • A2 = –n - (1/n) Σi[(2i – 1) log Z(i) + (2n + 1 – 2i) log (1 – Z(i))]

A estatística do teste de qualidade de ajuste modificada de Anderson-Darling é calculada para cada distribuição. Os valores-p são baseados na tabelas 4.8−4.22 em D'Agostino e Stephens2 Se nenhum valor-p exato for encontrado na tabela, o Minitab calcula o valor-p com base na interpolação utilizando uma variação do valor-p.

Observação

Os valores de p para o teste de Anderson-Darling não estão disponível para as distribuições para 3 parâmetros, com exceção para a distribuição Weibull.

Teste da razão de verossimilhança

O teste da razão de verossimilhança compara o ajuste de uma família de distribuição maior com um subconjunto da mesma família e determina se existe uma melhoria significativa no ajuste a distribuição maior. Por exemplo, para uma distribuição exponencial de 2 parâmetros, o teste da razão de verossimilhança compara o ajuste da família de distribuição exponencial de 2 parâmetros com o ajuste da família de distribuição exponencial de 1 parâmetro (um subconjunto com o segundo parâmetro sendo 0). Se uma distribuição exponencial de 2 parâmetros melhora significativamente o ajuste, então, o valor de p para a estatística do teste da razão de verossimilhança é muito baixo.

A estatística de teste da razão de verossimilhança é calculada da seguinte maneira.

Seja A a estimativa de máxima verossimilhança (EMV) do vetor de parâmetros para a família de distribuição maior (por exemplo, a família de distribuição de 3 parâmetros), e L(A) seja o log-verossimilhança. Seja B a EMV do vetor de parâmetros para a família de distribuição menor correspondente (por exemplo, a família de distribuição de 2 parâmetros correspondente), e L(B) seja o log-verossimilhança.

A estatística de teste da razão de verossimilhança =・2・*・L(A)・2・*・L(B).・  

Sob a hipótese nula, a família distribuição menor ajusta bem os dados. A estatística de teste da razão de verossimilhança é o qui-quadrado distribuído com df = dimensão do vetor (A) - dimensão do vetor (B).

1 W. Murray, Ed. (1972). Numerical Methods for Unconstrained Optimization. Academic Press.
2 M.A. Stephens (1986). Chapter 4: Tests based on EDF statistics. Goodness-of-Fit Techniques, ed. R.B. D'Agostino and M.A. Stephens.Marcel Dekker, Inc. 97-193.