Interpretar os principais resultados para Histograma

Complete os passos a seguir para interpretar um histograma.

Etapa 1: Avalie as características chaves

Examine os picos e dispersão da distribuição. Avalie como o tamanho da amostra pode afetar a aparência do histograma.

Picos e dispersão

Identificar os picos, que são os agrupamentos mais altos de barras. Os picos representam os valores mais comuns. Avalie a dispersão da sua amostra para entender o quanto seus dados variam.

Por exemplo, neste histograma dos tempos de espera do cliente, o pico de dados ocorre em cerca de 6 minutos. A dispersão de dados é a partir de cerca de 2 minutos a 12 minutos.

Investigue qualquer característica indesejável ou surpresa no histograma. Por exemplo, o histograma dos tempos de espera do cliente demonstrou uma dispersão que é maior do que o esperado. Uma investigação revelou que uma atualização de software aos computadores causou atrasos nos tempos de espera do cliente.

Tamanho de amostra (n)

O tamanho de amostra pode afetar a aparência do gráfico.

Por exemplo, apesar de estes histogramas parecerem diferentes, ambos foram criados usando amostras selecionadas aleatoriamente de dados da mesma população.
n = 20
n = 100

Um histograma funciona melhor quando o tamanho de amostra for de pelo menos 20. Se o tamanho de amostra for muito pequeno, cada barra no histograma pode não conter pontos de dados suficientes para demonstrar precisamente a distribuição dos dados. Quanto maior a amostra, mais o histograma se parecerá com a forma da distribuição de população. Se o tamanho amostral for menor do que 20, considere usar umgráfico de valor individual.

Etapa 2: Procure por indicadores de dados incomuns ou anormais

Dados assimétricos e dados multimodais indicam que os dados podem ser anormais. Os Outliers podem indicar outras condições em seus dados.

Dados assimétricos

Quando os dados são assimétricos, a maior parte dos dados está localizada no lado superior ou inferior do gráfico. A assimetria indica que os dados podem não ser normalmente distribuídos.

Estes histogramas ilustram dados assimétricos. O histograma com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O histograma com dados assimétricos à esquerda mostra os dados de tempos de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Assimétricos à direita
Assimétricos à esquerda

Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.

Outliers

Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados. Geralmente, outliers são a maneira mais fácil de identificar em um boxplot.

Em um histograma, as barras isoladas nas extremidades identificam os outliers.

Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.

Dados multimodais

Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.

Por exemplo, estes histogramas são gráficos dos mesmos dados. O histograma simples tem dois picos, mas não está claro o que os picos significam. O histograma com grupos demonstra que os picos correspondem a dois grupos.

Simples
Com grupos

Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o gráfico com grupos para determinar se a variável de grupo contabiliza os picos nos dados.

Dica

Para adicionar uma variável de grupo a um gráfico existente, clique duas vezes em uma representação de dados no gráfico e, logo, clique na abaGrupos.

Etapa 3: Avalie o ajuste de uma distribuição

Se seu histograma tiver uma linha de distribuição ajustada, avalie o quão perto as alturas das barras seguem o formato da linha. Se as barras seguirem a linha de distribuição ajustada de perto, os dados se ajustarão bem a distribuição.

Observação

Para informações sobre como especificar diferentes distribuições e parâmetros, vá para Linhas de distribuição ajustadas.

Bom ajuste
Ajuste ruim

Para uma medida precisa do ajuste de distribuição, use um gráfico de probabilidade para verificar o ajuste da significância estatística.

Passo 4: Avaliar e comparar grupos

Se seu histograma tiver grupos, avalie compare o centro e dispersão dos grupos.

Centros

Procure por diferenças entre os centros dos grupos.

Por exemplo, estes histogramas demonstram o tempo de conclusão para três versões de um pedido de cartão de crédito. O centro para cada versão do pedido de cartão de crédito está e um local diferente. As diferenças nos locais indicam que os tempos médios de conclusão são diferentes.
Histogramas sobrepostos
Histograma em painéis
Para determinar se uma diferença nas médias é estatisticamente significativa, realize uma das seguintes ações:

Dispersões

Procure por diferenças entre as dispersões dos grupos.

Por exemplo, estes histogramas demonstram os pesos dos jarros que foram cheios por três máquinas. Apesar de os histogramas terem quase o mesmo centro, alguns histogramas são mais amplos e dispersos. A dispersão mais ampla indica que tais máquinas enchem os jarros de forma menos consistente.
Histogramas sobrepostos
Histograma em painéis
Para determinar se a diferença na dispersão (variância) é estatisticamente significante, realize uma das seguintes ações: