Interpretar os principais resultados para Boxplot

Complete os passos a seguir para interpretar um boxplot.

Etapa 1: Avalie as características chaves

Examine o centro e a dispersão da distribuição. Avalie como o tamanho amostral pode afetar a aparência do boxplot.

Centro e dispersão

Examine os elementos a seguir para saber mais sobre o centro e dispersão de seus dados de amostra.
Mediana
A mediana é representada pela linha na caixa. A mediana é uma medida comum do centro de seus dados. Metade das observações são menores ou iguais, e metade são maiores ou iguais a elas.
Caixa da amplitude interquartílica
A caixa de amplitude interquartílica representa a metade, 50% dos dados. Ela mostra a distância entre o primeiro e o terceiro quartis (Q3-Q1).
Traços
Os traços se estendem de ambos os lados da caixa. Os traços representam as amplitudes para o fundo de 25% e o topo de 25% dos valores de dados, excluindo outliers.

Segure o ponteiro sobre o boxplot para exibir uma dica de ferramenta que mostra estas estatísticas. Por exemplo, este boxplot de frequência cardíaca em repouso mostra que a frequência cardíaca média é de 71. A maioria dos indivíduos têm frequência cardíaca em repouso na faixa entre 64 e 80, mas alguns indivíduos têm frequência cardíaca tão baixos quanto 48 e tão elevadas quanto 100.

Investigue qualquer característica indesejável ou surpreendente no boxplot. Por exemplo, um boxplot pode mostrar que o comprimento mediano das placas de madeira é muito menor do que o tamanho alvo de 8 pés.

Observação

Como os quartis do boxplot são valores calculados, eles não podem ser observações reais em seu ajuste de dados. Para mais informações sobre como interpretar os quartis, vá paraO que são quartis?. Para obter informações específicas sobre como são calculados os quartis, acesse Métodos e fórmulas para o resumo gráfico.

Tamanho de amostra (n)

O tamanho de amostra pode afetar a aparência do gráfico.

Por exemplo, apesar de estes boxplots parecerem diferentes, ambos foram criados usando amostras selecionadas aleatoriamente dos dados da mesma população.
n = 15
n = 500

Um boxplot funciona melhor quando o tamanho amostral é de pelo menos 20. Se o tamanho amostral for muito pequeno, os quartis e outliers demonstrados pelo boxplot podem não ser significantes. Se o tamanho amostral for menor do que 20, você pode usar um gráfico de valores individuais.

Etapa 2: Procure por indicadores de dados incomuns ou anormais

Dados assimétricos indicam que os dados podem ser anormais. Os outliers podem indicar outras condições em seus dados.

Dados assimétricos

Quando os dados são assimétricos, a maior parte dos dados está localizada no lado superior ou inferior do gráfico. A assimetria indica que os dados podem não ser normalmente distribuídos.

Estes boxplots ilustram dados assimétricos. O boxplot com dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O boxplot com dados assimétricos à esquerda mostra os dados de tempos de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Assimétricos à direita
Assimétricos à esquerda

Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.

Outliers

Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados. Geralmente, outliers são a maneira mais fácil de identificar em um boxplot.

Em um boxplot, os outliers são identificados por asteriscos (*).
Dica

Segure o ponteiro sobre o outlier para identificar o ponto de dados.

Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.

Passo 3: Avaliar e comparar grupos

Se seu boxplot tiver grupos, avalie e compare o centro e dispersão dos grupos.

Centros

Procure por diferenças entre os centros dos grupos.

Por exemplo, este boxplot mostra a espessura do fio produzido por quatro fornecedores. As espessuras das medianas para alguns grupos parecem ser diferentes.

Dispersões

Procure por diferenças entre as dispersões dos grupos.

Por exemplo, este boxplot mostra os pesos de enchimento de caixas de cereais de quatro linhas de produção. Os pesos medianos dos grupos de caixas de cereais são semelhantes, mas os pesos de alguns grupos são mais variáveis do que outros.
Para determinar se a diferença na dispersão (variância) é estatisticamente significante, realize uma das seguintes ações: