O que é a distribuição é normal?

A distribuição normal padrão é uma distribuição em forma de sino onde desvios padrão sucessivos da média estabelecem benchmarks para estimativa da porcentagem das observações de dados. Esses benchmarks são a base por trás de diversos testes de hipóteses como os testes z e t.

Histograma de uma distribuição normal hipotética

Como a distribuição dos dados é normal, é possível determinar exatamente qual porcentagem dos valores estará dentro de um intervalo específico. Por exemplo:
  • Cerca de 95% das observações estão dentro 2 desvios padrão da média, exibidos pela área sombreada azul. 95% dos valores estará dentro de 1,96 desvios padrão da média (entre -1,96 e +1,96). Assim, menos de 5% (0,05) das observações estarão fora desta amplitude. Esta amplitude é a base por trás do nível alfa de 0,05 de diversos testes de hipótese.
  • Cerca de 68% das observações estão dentro de 1 desvio padrão da média (-1 a +1), e cerca de 99,7% das observações estarão dentro de 3 desvios padrão da média (-3 a +3).

Exemplo de uma distribuição normal

A altura de todos os homens adultos residentes no estado da Pensilvânia é aproximadamente normalmente distribuída. Portanto, a altura da maioria dos homens estará próxima da altura média de 69 polegadas. Um número semelhante de homens será um pouco mais alto ou um pouco mais baixo do que 69 polegadas. Somente alguns serão muito mais altos ou muito mais baixos. O desvio padrão é 2,5 polegadas.

Aproximadamente 68% dos homens da Pensilvânia têm entre 1,69 (μ - 1σ) e 1,81 (μ + 1σ) metro de altura.

Aproximadamente 95% dos homens da Pensilvânia têm entre 1,62 (μ - 2σ) e 1,88 (μ + 2σ) metro de altura.

Aproximadamente 99,7% dos homens da Pensilvânia têm entre 1,56 (μ - 3σ) e 1,94 (μ + 3σ) metro de altura.