Examinez le centrage et la répartition de la loi de distribution. Evaluez l'incidence de l'effectif de l'échantillon sur l'apparence du diagramme à branches et feuilles.
Pour chaque ligne, le nombre dans la branche (colonne du milieu) représente le(s) premier(s) chiffre(s) des valeurs d'échantillon. L'unité "feuille" en haut du graphique indique la décimale représentée par les valeurs de feuille.
Examinez toute caractéristique surprenante ou indésirable. Par exemple, le diagramme à branches et feuilles du temps d'attente des clients a montré des valeurs supérieures et plus répandues que prévu. Une enquête a révélé qu'un trafic Internet important causait de l'instabilité et des ralentissements.
L'effectif de l'échantillon peut avoir une incidence sur l'apparence du graphique.
L'effectif d'échantillon est affiché en haut du diagramme à branches et feuilles. Dans l'exemple précédent, l'effectif d'échantillon était 50 (N = 50).
Etant donné qu'un diagramme à branches et feuilles représente chaque valeur de données, il est adapté lorsque l'effectif de l'échantillon est inférieur à 50 environ. Si l'échantillon est supérieur à 50, les points de données risquent de trop s'étendre sur le diagramme et la loi de distribution peut être difficile à évaluer. Si vous disposez de plus de 50 points de données, envisagez d'utiliser une boîte à moustaches ou un histogramme.
Des données asymétriques et multimodales peuvent indiquer la présence de données non normales. Des valeurs aberrantes peuvent indiquer la présence d'autres conditions dans vos données.
Déterminez si vos données sont asymétriques. Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. L'asymétrie indique que les données peuvent ne pas être normalement distribuées. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.
Ces diagrammes à branches et feuilles représentent des données asymétriques. Le diagramme à branches et feuilles avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. Le diagramme à branches et feuilles avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour un bien plus grand nombre d'entre eux, la défaillance survient plus tard.
Si vous savez que vos données ne sont pas naturellement asymétriques, étudiez-en les causes possibles. Pour analyser les données très asymétriques, consultez la rubrique sur les observations relatives aux données pour l'analyse afin de vous assurer que vous pouvez utiliser des données non normales.
Les valeurs aberrantes, qui sont des valeurs très éloignées des autres, peuvent avoir une incidence importante sur vos résultats.
Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de saisie des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse.
Les données multimodales ont plusieurs pics. (Un pic représente le mode d'un ensemble de données.) Les données multimodales surviennent généralement lorsque les données sont collectées à partir de plusieurs procédés ou conditions, par exemple, pour plusieurs températures.
Par exemple, ces diagrammes à branches et feuilles sont des graphiques représentant les mêmes données. Le diagramme à branches et feuilles simple présente deux groupes de points, mais leur signification n'est pas claire. Le diagramme à branches et feuilles avec groupes permet de distinguer deux groupes.
Si des informations supplémentaires vous permettent de classer les observations en groupes, vous pouvez créer une variable de groupe avec ces informations. Vous pouvez ensuite créer le graphique avec des groupes pour déterminer si la variable de groupe explique les pics dans les données.