A2 mede a área entre a linha ajustada (que se baseia na distribuição escolhido) e na função da etapa não-paramétrica (que tem por base os pontos do gráfico). A estatística é uma distância ao quadrado que é ponderado mais pesadamente nas caudas da distribuição. Um valor pequeno de Anderson-Darling indica que a distribuição se ajusta melhor aos dados.
O teste de normalidade de Anderson-Darling é definido como:
H0: os dados seguem uma distribuição normal.
H1: os dados não seguem uma distribuição normal.
Termo | Descrição |
---|---|
F(Yi) | ![]() |
Yi | dados ordenados |
A medida quantitativa para relatar o resultado do teste de normalidade de Anderson-Darling é o valor de p. Um valor de p pequeno indica que a hipótese nula é falsa.
Se você conhecer A2 poderá calcular o valor de p.
Permita que
O número de valores não faltantes na amostra.
O desvio padrão da amostra fornece uma medida da dispersão dos seus dados. Ela é igual à raiz quadrada da variância da amostra.
Termo | Descrição |
---|---|
x i | i a observação |
![]() | média das observações |
N | número de observações não ausentes |
A variância mede o quanto os dados estão dispersos em relação à sua média. A variância é igual ao desvio padrão ao quadrado.
Termo | Descrição |
---|---|
xi | ia observação |
![]() | média das observações |
N | número de observações não ausentes |
A assimetria é uma medida de assimetria. Um valor negativo indica assimetria para a esquerda e um valor positivo indica assimetria para a direita. Um valor zero não indica necessariamente simetria.
Termo | Descrição |
---|---|
xi | i a observação |
![]() | média das observações |
N | número de observações não ausentes |
s | desvio padrão da amostra |
Curtose é uma medida de quantidade de diferença de uma distribuição a partir da distribuição normal. Um valor positivo geralmente indica que a distribuição tem um pico mais acentuado do que a distribuição normal. Um valor negativo indica que a distribuição tem um pico mais plano do que a distribuição normal.
Termo | Descrição |
---|---|
xi | i a observação |
![]() | média das observações |
N | número de observações não ausentes |
s | desvio padrão da amostra |
Uma medida tipicamente utilizada do centro de um grupo de números. A média é também chamada de a média. Ela é a soma de todas as observações dividida pelo número de observações (não faltantes).
Termo | Descrição |
---|---|
xi | ia observação |
N | número de observações não ausentes |
O menor valor em seu conjunto de dados.
O maior valor em seu conjunto de dados.
25% das suas observações da amostra são menores ou iguais ao valor do 1o quartil. Portanto o 1o quartil também é conhecido como o 25o percentil.
Termo | Descrição |
---|---|
y | valor inteiro truncado de w |
w | ![]() |
z | componente fracionário de w que foi truncado |
xj | ja observação na lista de dados da amostra, ordenada do menor ao maior |
Quando w é um inteiro, y = w, z = 0 e Q1 = xy.
A mediana da amostra fica no meio dos dados: pelo menos metade das observações são menores ou iguais a ela, e pelo menos metade são maiores ou iguais a ela.
Suponha que você tenha uma coluna que contém valores de N. Para calcular a mediana, primeiro ordene seus valores de dados do menor ao maior. Se N for ímpar, a mediana da amostra é o valor no meio. Se N for par, a mediana da amostra é a média dos dois valores do meio.
Por exemplo, quando N = 5 e você tem dados x1, x2, x3, x4 e x5, a mediana = x3.
Quando N = 6 e você ordenou os dados x1, x2, x3, x4, x5 e x6:
em que x3 e x4 são a terceira e quarta observações.
75% das suas observações da amostra são menores ou iguais ao valor do terceiro quartil. Portanto, o terceiro quartil também é conhecido como o 75o percentil.
Termo | Descrição |
---|---|
y | valor truncado de w |
w |
![]() |
z | componente fracionário de w que foi truncado |
xj | ja observação na lista de dados da amostra, ordenada do menor ao maior |
Quando w é um inteiro, y = w, z = 0 e Q3 = xy.
Termo | Descrição |
---|---|
![]() | média |
s | desvio padrão da amostra |
N | número não faltante |
t N, α | probabilidade acumulada inversa de uma distribuição t com n-1 graus de liberdade em 1-α/2; α = 1 – nível de confiança / 100 |
O Minitab usa interpolação linear para calcular o intervalo de confiança para a média verdadeira 1. Este método é uma aproximação muito boa para uma grande variedade de distribuições simétricas, incluindo a distribuição normal, a distribuição de Cauchy, e a distribuição uniforme. Exemplos de distribuições não simétricas mostram resultados adequados que são sempre muito mais preciso do que a interpolação linear.
O Minitab calcula um intervalo de confiança de (1 – α) 100% para o desvio padrão da população, σ. O intervalo de confiança é muito sensível à suposição de que os dados são normais. Mesmo pequenos desvios da normalidade podem resultar em um intervalo de confiança equivocado.
O intervalo de confiança vai de:
Termo | Descrição |
---|---|
s | desvio padrão |
N | número não faltante |
χ2N, α | probabilidade acumulada inversa de um χ2 com N graus de liberdade a 1 – α / 2; α = 1 – nível de confiança / 100 |