Examine os picos e dispersão de distribuição. Avalie como o tamanho da amostra pode afetar a aparência do diagrama de pontos.
Identifique os picos, que são as caixas com mais pontos. Os picos representam os valores mais comuns na amostra. Avalie a dispersão de sua amostra para entender como seus dados variam.
Investigue qualquer característica indesejável ou surpresa no diagrama de pontos. Por exemplo, o diagrama de pontos dos tempos de espera demonstrou uma dispersão que é maior do que o esperado. Uma investigação revelou que uma atualização de software aos computadores causaram instabilidade e atrasos nos tempos de espera do cliente.
O tamanho de amostra pode afetar a aparência do gráfico.
Um diagrama de pontos é melhor quando o tamanho amostral for menor do que aproximadamente 50. Se o tamanho da amostra é de 50 ou superior, um ponto pode representar mais do que uma observação. Considere o uso de um boxplot ou de um histograma além de um diagrama de pontos, para que você possa identificar mais facilmente as características principais da distribuição.
Dados assimétricos e dados com multimodos indicam que os dados podem ser anormais. Os Outliers podem indicam outras condições em seus dados.
Quando os dados são assimétricos, a maior parte dos dados está localizada no lado superior ou inferior do gráfico. A assimetria indica que os dados podem não ser normalmente distribuídos. Geralmente, a assimetria é mais fácil de detectar com umhistograma ou um boxplot.
Estes diagramas de pontos ilustram dados assimétricos. O diagrama de pontos com dados assimétricos à direita mostra tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O diagrama de pontos com dados assimétricos à esquerda demonstra dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.
Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se você desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.
Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados. Geralmente, outliers são a maneira mais fácil de identificar em um boxplot.
Segure o ponteiro sobre o outlier para identificar o ponto de dados.
Tente identificar a causa de qualquer outliers. Corrija os erros de entrada de dados ou de medição. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.
Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.
Por exemplo, estes diagramas de pontos são gráficos dos mesmos dados. O diagrama de ponto simples tem dois picos, mas não está claro o que cada pico significa. O diagrama de pontos com grupos demonstra que os picos correspondem a dois grupos.
Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o gráfico com grupos para determinar se a variável de grupo contabiliza os picos nos dados.
Para adicionar uma variável de grupo a um gráfico existente, clique duas vezes em uma representação de dados no gráfico e, logo, clique na abaGrupos.
Se seu diagrama de pontos tiver grupos, avalie e compare o centro e dispersão dos grupos.
Procure por diferenças entre os centros dos grupos.
Procure por diferenças entre as dispersões dos grupos.