Examine o centro e a dispersão da distribuição. Avalie como o tamanho amostral pode afetar a aparência do diagrama ramo-e-folhas.
Para cada linha, o número no "ramo" (coluna do meio) representa o primeiro dígito (ou dígitos) dos valores das amostras. A "unidade de folha" no topo do gráfico indica qual casa decimal os valores da folha representam.
Este diagrama ramo-e-folhas mostra os tempos de espera do cliente para um chat de serviço ao cliente on-line com um representante. A primeira linha tem um valor de ramo 8 e contém os valores de folha 0, 2 e 3. A unidade de folha é 1. Assim, a primeira linha do gráfico representa os valores de amostra de aproximadamente 80, 82 e 83. Os valores variam de 80 a 119 segundos. A mediana está na linha que tem valores entre 95 e 99 segundos.
3 | 8 | 023 |
---|---|---|
8 | 8 | 56688 |
21 | 9 | 0111111222444 |
(6) | 9 | 555799 |
23 | 10 | 0000111233 |
13 | 10 | 55667789 |
5 | 11 | 14 |
3 | 11 | 579 |
Investigue qualquer característica indesejável ou surpreendente. Por exemplo, o diagrama ramo-e-folhas de tempos de espera dos clientes apresentou valores mais elevados e uma dispersão maior do que o esperado. Uma investigação revelou que o tráfego de rede excepcionalmente pesado causou instabilidade e atrasos.
O tamanho de amostra pode afetar a aparência do gráfico.
O tamanho amostral é exibido no topo do diagrama ramo-e-folhas. No exemplo anterior, o tamanho amostral é de 50 (N = 50).
Como um diagrama ramo-e-folhas representa cada valor de dados, ele é melhor quando o tamanho amostral é inferior a aproximadamente 50. Se a amostra for superior a 50, os pontos de dados no gráfico podem se estender para uma distância longa, e a distribuição pode ser difícil de ser avaliada. Se você tiver mais de 50 pontos de dados, pense em usar um boxplot ou um histograma.
Dados assimétricos e dados multimodais indicam que os dados podem ser anormais. Os outliers podem indicar outras condições em seus dados.
Determine se os seus dados estão assimétricos. Quando os dados são assimétricos, a maior parte dos dados está localizada no lado alto ou baixo do gráfico. Assimetria indica que os dados podem estar normalmente distribuídos. Frequentemente, a assimetria é mais fácil de detectar com um histograma ou um boxplot.
Estes diagramas ramo-e-folhas ilustram os dados assimétricos. O diagrama ramo-e-folhas com os dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O diagrama ramo-e-folhas com os dados assimétricos à esquerda mostra dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.
1 | -0 | 4 |
---|---|---|
6 | -0 | 33222 |
16 | -0 | 1111111111 |
(16) | 0 | 0000000011111111 |
18 | 0 | 22222333333 |
7 | 0 | 4555 |
3 | 0 | 6 |
2 | 0 | |
2 | 1 | |
2 | 1 | 2 |
1 | 1 | 4 |
3 | -1 | 333 |
---|---|---|
3 | -1 | |
5 | -0 | 99 |
6 | -0 | 6 |
8 | -0 | 44 |
24 | -0 | 3333333322222222 |
(7) | -0 | 1111111 |
21 | 0 | 000001111111 |
9 | 0 | 22233 |
4 | 0 | 445 |
1 | 0 | 6 |
Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.
Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados.
Em um diagrama ramo-e-folhas, valores isolados nas extremidades identificam possíveis outliers. Por exemplo, o último valor, na parte inferior deste gráfico pode ser um outlier.
2 | -2 | 20 |
---|---|---|
4 | -1 | 52 |
(13) | -0 | 8886555433300 |
14 | 0 | 00334688 |
6 | 1 | 0046 |
2 | 2 | 5 |
1 | 3 | |
1 | 4 | |
1 | 5 | |
1 | 6 | |
1 | 7 | |
1 | 8 | 0 |
Tente identificar a causa de qualquer outliers. Corrija quaisquer erros de entrada de dados. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.
Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.
Por exemplo, estes diagramas ramo-e-folhas são gráficos dos mesmos dados. O diagrama ramo-e-folhas simples tem dois agrupamentos de pontos, mas não é claro o que os agrupamentos significam. O diagrama ramo-e-folhas com grupos mostra que os agrupamentos correspondem a dois grupos.
2 | 7 | 18 |
---|---|---|
5 | 8 | 589 |
21 | 9 | 0122235555677889 |
37 | 10 | 0122233334556778 |
(14) | 11 | 13334455667789 |
49 | 12 | 2599 |
45 | 13 | 0012334667778888888 |
26 | 14 | 000011122236777888 |
8 | 15 | 0245779 |
1 | 16 | 1 |
2 | 11 | 59 |
---|---|---|
5 | 12 | 259 |
24 | 13 | 0012334667778888888 |
(18) | 14 | 000011122236777888 |
8 | 15 | 0245779 |
1 | 16 | 1 |
2 | 7 | 18 |
---|---|---|
5 | 8 | 589 |
21 | 9 | 0122235555677889 |
(16) | 10 | 0122233334556778 |
13 | 11 | 133344566778 |
1 | 12 | 9 |
Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o gráfico com grupos para determinar se a variável de grupo contabiliza os picos nos dados.