Interpretar os principais resultados para Diagrama ramo-e-folhas.

Conclua as etapas a seguir para interpretar um diagrama ramo-e-folhas.

Etapa 1: Avalie as características chaves

Examine o centro e a dispersão da distribuição. Avalie como o tamanho amostral pode afetar a aparência do diagrama ramo-e-folhas.

Centro e dispersão

Examine os elementos a seguir para saber mais sobre seus dados de amostra.
Contagens e mediana
As contagens estão na primeira coluna do lado esquerdo. A contagem para a linha que contém o valor mediano é colocada entre parênteses. Os valores para as linhas acima e abaixo da mediana são acumulados. A contagem de uma linha acima da mediana representa a contagem total daquela linha e de todas linhas acima dela. O valor para uma linha abaixo a mediana representa a contagem total daquela linha e de todas linhas abaixo dela.
Valores de dados

Para cada linha, o número no "ramo" (coluna do meio) representa o primeiro dígito (ou dígitos) dos valores das amostras. A "unidade de folha" no topo do gráfico indica qual casa decimal os valores da folha representam.

Dispersão
A dispersão mostra o quanto os dados variam.

Este diagrama ramo-e-folhas mostra os tempos de espera do cliente para um chat de serviço ao cliente on-line com um representante. A primeira linha tem um valor de ramo 8 e contém os valores de folha 0, 2 e 3. A unidade de folha é 1. Assim, a primeira linha do gráfico representa os valores de amostra de aproximadamente 80, 82 e 83. Os valores variam de 80 a 119 segundos. A mediana está na linha que tem valores entre 95 e 99 segundos.

Diagrama Ramo-e-Folhas de C1   N = 50

38023
8856688
2190111111222444
(6)9555799
23100000111233
131055667789
51114
311579
Unidade de Folha = 1

Investigue qualquer característica indesejável ou surpreendente. Por exemplo, o diagrama ramo-e-folhas de tempos de espera dos clientes apresentou valores mais elevados e uma dispersão maior do que o esperado. Uma investigação revelou que o tráfego de rede excepcionalmente pesado causou instabilidade e atrasos.

Tamanho de amostra (n)

O tamanho de amostra pode afetar a aparência do gráfico.

O tamanho amostral é exibido no topo do diagrama ramo-e-folhas. No exemplo anterior, o tamanho amostral é de 50 (N = 50).

Como um diagrama ramo-e-folhas representa cada valor de dados, ele é melhor quando o tamanho amostral é inferior a aproximadamente 50. Se a amostra for superior a 50, os pontos de dados no gráfico podem se estender para uma distância longa, e a distribuição pode ser difícil de ser avaliada. Se você tiver mais de 50 pontos de dados, pense em usar um boxplot ou um histograma.

Etapa 2: Procure por indicadores de dados incomuns ou anormais

Dados assimétricos e dados multimodais indicam que os dados podem ser anormais. Os outliers podem indicar outras condições em seus dados.

Dados Assimétricos

Determine se os seus dados estão assimétricos. Quando os dados são assimétricos, a maior parte dos dados está localizada no lado alto ou baixo do gráfico. Assimetria indica que os dados podem estar normalmente distribuídos. Frequentemente, a assimetria é mais fácil de detectar com um histograma ou um boxplot.

Estes diagramas ramo-e-folhas ilustram os dados assimétricos. O diagrama ramo-e-folhas com os dados assimétricos à direita mostra os tempos de espera. A maioria dos tempos de espera são relativamente curtos e apenas alguns tempos de espera são longos. O diagrama ramo-e-folhas com os dados assimétricos à esquerda mostra dados de tempo de falha. Alguns itens falham imediatamente e muitos outros itens falham posteriormente.

Diagrama Ramo-e-Folhas de C1   N = 50

1-04
6-033222
16-01111111111
(16)00000000011111111
18022222333333
704555
306
20 
21 
212
114
Unidade de Folha = 0,1

Assimétricos à direita

Diagrama Ramo-e-Folhas de C1   N = 52

3-1333
3-1 
5-099
6-06
8-044
24-03333333322222222
(7)-01111111
210000001111111
9022233
40445
106
Unidade de Folha = 0,1

Assimétricos à esquerda

Se você sabe que seus dados não são naturalmente assimétricos, investigue as possíveis causas. Se desejar analisar dados severamente assimétricos, leia o tópico de considerações de dados para análise para garantir que você pode usar dados que não são normais.

Outliers

Outliers, que são valores de dados que estão distantes dos outros valores de dados, podem afetar fortemente seus resultados.

Em um diagrama ramo-e-folhas, valores isolados nas extremidades identificam possíveis outliers. Por exemplo, o último valor, na parte inferior deste gráfico pode ser um outlier.

Diagrama Ramo-e-Folhas de C1   N = 31

2-220
4-152
(13)-08886555433300
14000334688
610046
225
13 
14 
15 
16 
17 
180
Unidade de Folha = 0,1

Tente identificar a causa de qualquer outliers. Corrija quaisquer erros de entrada de dados. Considere a remoção de valores de dados que estejam associados a eventos anormais que ocorrem somente uma vez (causas especiais). Em seguida, repita a análise.

Dados multimodais

Dados multimodais têm mais do que um pico. (Um pico representa o modo de um ajuste de dados.) Os dados multimodais geralmente ocorrem quando os dados são coletados a partir de mais de um processo ou condição, como mais do que uma temperatura.

Por exemplo, estes diagramas ramo-e-folhas são gráficos dos mesmos dados. O diagrama ramo-e-folhas simples tem dois agrupamentos de pontos, mas não é claro o que os agrupamentos significam. O diagrama ramo-e-folhas com grupos mostra que os agrupamentos correspondem a dois grupos.

Diagrama Ramo-e-Folhas de C1   N = 100

2718
58589
2190122235555677889
37100122233334556778
(14)1113334455667789
49122599
45130012334667778888888
2614000011122236777888
8150245779
1161
Unidade de Folha = 0,1

Simples

Diagrama Ramo-e-Folhas de C1    C2 = 1    N = 50

21159
512259
24130012334667778888888
(18)14000011122236777888
8150245779
1161
Unidade de Folha = 0,1

Diagrama Ramo-e-Folhas de C1    C2 = 2    N = 50

2718
58589
2190122235555677889
(16)100122233334556778
1311133344566778
1129
Unidade de Folha = 0,1

Com grupos

Se você tiver informações adicionais que permitem a classificação das observações em grupos, poderá criar uma variável de grupo com estas informações. Depois, você poderá criar o gráfico com grupos para determinar se a variável de grupo contabiliza os picos nos dados.