Examine o centro e a dispersão da distribuição. Avalie como o tamanho amostral pode afetar a aparência do diagrama ramo-e-folhas.
Para cada linha, o número no "ramo" (coluna do meio) representa o primeiro dígito (ou dígitos) dos valores das amostras. A "unidade de folha" no topo do gráfico indica qual casa decimal os valores da folha representam.
Investigue qualquer característica indesejável ou surpreendente. Por exemplo, o diagrama ramo-e-folhas de tempos de espera dos clientes apresentou valores mais elevados e uma dispersão maior do que o esperado. Uma investigação revelou que o tráfego de rede excepcionalmente pesado causou instabilidade e atrasos.
O tamanho de amostra pode afetar a aparência do gráfico.
O tamanho amostral é exibido no topo do diagrama ramo-e-folhas. No exemplo anterior, o tamanho amostral é de 50 (N = 50).
Como um diagrama ramo-e-folhas representa cada valor de dados, ele é melhor quando o tamanho amostral é inferior a aproximadamente 50. Se a amostra for superior a 50, os pontos de dados no gráfico podem se estender para uma distância longa, e a distribuição pode ser difícil de ser avaliada. Se você tiver mais de 50 pontos de dados, pense em usar um boxplot ou um histograma.
Dados assimétricos e dados multimodais indicam que os dados podem ser anormais. Os outliers podem indicar outras condições em seus dados.
Determine se os seus dados estão assimétricos. Quando os dados são assimétricos, a maior parte dos dados está localizada no lado alto ou baixo do gráfico. Assimetria indica que os dados podem estar normalmente distribuídos. Frequentemente, a assimetria é mais fácil de detectar com um histograma ou um boxplot.
Estes diagramas ramo-e-folhas ilustram os dados assimétricos. O diagrama ramo-e-folhas com os dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O diagrama ramo-e-folhas com os dados assimétricos à esquerda mostra dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.
Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.
Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados.
Tente identificar a causa de qualquer outliers. Corrija quaisquer erros de entrada de dados. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.
Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.
Por exemplo, estes diagramas ramo-e-folhas são gráficos dos mesmos dados. O diagrama ramo-e-folhas simples tem dois agrupamentos de pontos, mas não é claro o que os agrupamentos significam. O diagrama ramo-e-folhas com grupos mostra que os agrupamentos correspondem a dois grupos.
Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o gráfico com grupos para determinar se a variável de grupo contabiliza os picos nos dados.