Interpretar os principais resultados para Diagrama de pontos

Complete os passos a seguir para interpretar um diagrama de ponto.

Etapa 1: Avalie as características chaves

Examine os picos e dispersão de distribuição. Avalie como o tamanho da amostra pode afetar a aparência do diagrama de pontos.

Picos e dispersão

Identifique os picos, que são as caixas com mais pontos. Os picos representam os valores mais comuns na amostra. Avalie a dispersão de sua amostra para entender como seus dados variam.

Por exemplo, neste diagrama de pontos dos tempos de espera do cliente, o pico dos dados ocorrem em cerca de 6 minutos. A dispersão de dados surge a partir de 3,5 minutos a 8,5 minutos.

Investigue qualquer característica indesejável ou surpresa no diagrama de pontos. Por exemplo, o diagrama de pontos dos tempos de espera demonstrou uma dispersão que é maior do que o esperado. Uma investigação revelou que uma atualização de software aos computadores causaram instabilidade e atrasos nos tempos de espera do cliente.

Tamanho amostral (n)

O tamanho de amostra pode afetar a aparência do gráfico.

Por exemplo, apesar de estes diagramas de pontos parecerem diferentes, ambos foram criados usando amostras selecionadas aleatoriamente dos dados da mesma população. No primeiro diagrama de pontos, cada símbolo representa uma observação. No segundo diagrama de pontos, cada símbolo representa até três observações.
n = 20
n = 100

Um diagrama de pontos é melhor quando o tamanho amostral for menor do que aproximadamente 50. Se o tamanho da amostra é de 50 ou superior, um ponto pode representar mais do que uma observação. Considere o uso de um boxplot ou de um histograma além de um diagrama de pontos, para que você possa identificar mais facilmente as características principais da distribuição.

Etapa 2: Procure por indicadores de dados incomuns ou anormais

Dados assimétricos e dados com multimodos indicam que os dados podem ser anormais. Os Outliers podem indicam outras condições em seus dados.

Dados assimétricos

Quando os dados são assimétricos, a maior parte dos dados está localizada no lado superior ou inferior do gráfico. A assimetria indica que os dados podem não ser normalmente distribuídos. Geralmente, a assimetria é mais fácil de detectar com umhistograma ou um boxplot.

Estes diagramas de pontos ilustram dados assimétricos. O diagrama de pontos com dados assimétricos à direita mostra tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O diagrama de pontos com dados assimétricos à esquerda demonstra dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Assimétricos à direita
Assimétricos à esquerda

Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.

Outliers

Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados. Geralmente, outliers são a maneira mais fácil de identificar em um boxplot.

Em um diagrama de pontos, valores de dados incomuns altos ou baixos identificam possíveis outliers.
Dica

Segure o ponteiro sobre o outlier para identificar o ponto de dados.

Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.

Dados multimodais

Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.

Por exemplo, estes diagramas de pontos são gráficos dos mesmos dados. O diagrama de ponto simples tem dois picos, mas não está claro o que cada pico significa. O diagrama de pontos com grupos demonstra que os picos correspondem a dois grupos.

Simples
Com grupos

Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o gráfico com grupos para determinar se a variável de grupo contabiliza os picos nos dados.

Dica

Para adicionar uma variável de grupo a um gráfico existente, clique duas vezes em uma representação de dados no gráfico e, logo, clique na abaGrupos.

Passo 3: Avaliar e comparar grupos

Se seu diagrama de pontos tiver grupos, avalie e compare o centro e dispersão dos grupos.

Centros

Procure por diferenças entre os centros dos grupos.

Por exemplo, estes diagramas de pontos demonstram o tempo de conclusão para quatro versões de um pedido de cartão de crédito. O centro para cada versão do pedido de cartão de crédito está e um local diferente. As diferenças nos locais indicam que os tempos de conclusão são diferentes.
Diagramas de pontos em painéis
Diagramas de pontos empilhados
Para determinar se uma diferença nas médias é estatisticamente significativa, realize uma das seguintes ações:

Dispersões

Procure por diferenças entre as dispersões dos grupos.

Por exemplo, estes diagramas de pontos demonstram os pesos dos jarros que foram cheios por três máquinas. Embora os diagramas de pontos tenham quase o mesmo centro, os diagramas de pontos são mais amplos e dispersos. A dispersão mais ampla indica que tais máquinas enchem os jarros de forma menos consistente.
Diagramas de pontos em painéis
Diagramas de pontos empilhados
Para determinar se a diferença na dispersão (variância) é estatisticamente significante, realize uma das seguintes ações: