Métodos e fórmulas para Teste de normalidade

Selecione o método ou a fórmula de sua escolha.

Média

Uma medida tipicamente utilizada do centro de um grupo de números. A média é também chamada de a média. Ela é a soma de todas as observações dividida pelo número de observações (não faltantes).

Fórmula

Notação

TermoDescrição
xiia observação
Nnúmero de observações não ausentes

Desvio padrão (StDev)

O desvio padrão da amostra fornece uma medida da dispersão dos seus dados. Ela é igual à raiz quadrada da variância da amostra.

Fórmula

Se a coluna contiver x 1, x 2,..., x N, com a média , então, o desvio padrão dos dados da amostra é:

Notação

TermoDescrição
x i i a observação
média das observações
N número de observações não ausentes

N

O Minitab exibe o número de observações não faltantes em uma amostra.

Anderson-Darling

A2 mede a área entre a linha ajustada (que se baseia na distribuição escolhido) e na função da etapa não-paramétrica (que tem por base os pontos do gráfico). A estatística é uma distância ao quadrado que é ponderada mais fortemente nas caudas da distribuição. Um valor pequeno de Anderson-Darling indica que a distribuição se ajusta melhor aos dados.

O teste de normalidade de Anderson-Darling é definido como:

H0: os dados seguem uma distribuição normal.

H1: os dados não seguem uma distribuição normal.

Fórmula

Outra medida quantitativa para reportar o resultado do teste de normalidade é o valor p. Um pequeno valor p indica que a hipótese nula é falsa.

Se você souber A2 , pode calcular o valor p. Seja:
Dependendo de A'2, você vai calcular p com as seguintes equações:
  • Se 13 >A'2 > 0,600 então p = exp(1,2937 - 5,709 * A'2 + 0,0186(A'2)2)
  • Se 0,600 >A'2 > 0,340, então p = exp(0,9177 - 4,279 * A'2 – 1,38(A'2)2)
  • Se 0,340 >A'2 > 0,200, então p = 1 – exp(–8,318 + 42,796 * A'2 – 59,938(A'2)2)
  • SeA'2 <0.200 then p = 1 – exp(–13.436 + 101.14 * A'2 – 223,73(A'2)2)

Notação

TermoDescrição
F(Yi), que é a função de distribuição cumulativa da distribuição normal padrão
Yidados ordenados

Ryan-Joiner

O teste Ryan-Joiner fornece um coeficiente de correlação, que indica a correlação entre seus dados e as pontuações normais das estatísticas de ordem dos dados. Se o coeficiente de correlação estiver próximo de 1, seus dados ficarão próximos do gráfico de probabilidade normal. Se for menor que o valor crítico adequado, você vai rejeitar a hipótese nula de normalidade.

Fórmula

O coeficiente de correlação é calculado como:
As pontuações normais das estatísticas de ordem têm a seguinte definição:
onde n é o tamanho da amostra e i é o posto da observação ordenada. Atribuir observações empatadas à média de suas classificações. Por exemplo, se duas observações empatadas estiverem nas posições 5 e 6 nos dados ordenados, então atribua a cada uma a uma a classificação 5,5.
O valor p é calculado usando o fator de correção, que depende do tamanho da amostra (n). Use o fator correspondente ao seu nível de significância. Por exemplo, se α = 0,05, use um cor05.
Se n ≥ 50
Se n < 50
Depois, compare o coeficiente de correlação com o fator de correção para determinar o valor-p:
  • Se Rp > cor10, então p > 0,10.
  • Se cor05 < Rpcor10, então:
  • Se cor01 < Rpcor05, então:
  • Se Rpcor01, então p < 0.01.

Notação

TermoDescrição
YiObservações ordenadas
biEstatísticas normais de pontuação da ordem
s2variância da amostra
nTamanho amostral
iClassificação dos dados ordenados

Kolmogorov-Smirnov

Fórmula

O teste de Kolmogorov-Smirnov é definido como:
  • H0: os dados seguem uma distribuição normal.
  • H1: os dados não seguem uma distribuição normal.
A estatística de teste de Kolmogorov-Smirnov é definida como:

Para determinar o valor p, o Minitab utiliza uma estatística ajustada (d*) que leva em conta o tamanho da amostra (n).

Compare d* com os seguintes valores críticos para determinar o valor p:

  • Se d* < 0.775, então p > 0,15.
  • Se 0,775 ≤ d* < 0.819, então:
  • Se 0,819 ≤ d* < 0.895, então:
  • Se 0,895 ≤ d* < 0.995, então:
  • Se 0,995 ≤ d* < 1.035, então:
  • Se d* ≥ 1,035, então p < 0.01.

Notação

TermoDescrição
D+maxi {i / nZ (i)}
Dmaxi {Z (i) – (i – 1) / n)}
ZF(X(i))
F(x)função de distribuição de probabilidade da distribuição normal
X(i)i-ésimas ordem estatísticas de uma amostra aleatória, 1 ≤ i ≤ n
nTamanho amostral

Pontos do gráfico

Em geral, quanto mais próximos estiverem os pontos da linha ajustada, melhor o ajuste. O Minitab fornece duas medidas de qualidade de ajuste para ajudar a avaliar a forma como a distribuição ajusta seus dados.

Fórmula

A tabela abaixo mostra como a linha do meio é construída:
Distribuição coordenada x coordenada y
Normal x Φ–1 norm

Notação

TermoDescrição
Φ–1 norm valor retornado para p pela fda inversa para a distribuição normal padrão

Gráficos de probabilidade

Os dados de entrada estão representados graficamente como valores de x. O Minitab calcula a probabilidade de ocorrência sem supor uma distribuição. A escala Y no gráfico assemelha-se à escala Y encontrada no artigo sobre probabilidade normal, em que as probabilidades são representadas graficamente como uma linha reta, como se os dados fossem de uma distribuição normal.