Examinez les pics et la dispersion de la loi de distribution. Evaluez l'impact de l'effectif de l'échantillon sur l'apparence de l'histogramme.
Identifiez les pics, qui correspondent aux groupes de barres les plus hautes. Les pics représentent les valeurs les plus courantes. Evaluez la dispersion de l'échantillon pour comprendre la variation des données.
Examinez toute caractéristique surprenante ou indésirable dans l'histogramme. Par exemple, l'histogramme des temps d'attente des clients indique une dispersion plus étendue que prévu. Une étude a révélé qu'une mise à jour logicielle sur les ordinateurs a entraîné des retards dans les temps d'attente des clients.
L'effectif de l'échantillon peut avoir une incidence sur l'apparence du graphique.
Une histogramme est adapté lorsque l'effectif de l'échantillon est d'au moins 20. Si l'effectif de l'échantillon est trop petit, chaque barre de l'histogramme peut ne pas contenir suffisamment de points de données pour afficher avec précision leur distribution. Plus l'échantillon est important, plus l'histogramme ressemble à la forme de la distribution de la population. Si l'effectif d'échantillon est inférieur à 20, envisagez plutôt d'utiliser un diagramme des valeurs individuelles.
Des données asymétriques et multimodales peuvent indiquer la présence de données non normales. Des valeurs aberrantes peuvent indiquer la présence d'autres conditions dans vos données.
Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. L'asymétrie indique que les données peuvent ne pas être normalement distribuées.
Ces histogrammes illustrent des données asymétriques. L'histogramme avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. L'histogramme avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.
Si vous savez que vos données ne sont pas naturellement asymétriques, étudiez-en les causes possibles. Pour analyser les données très asymétriques, consultez la rubrique sur les observations relatives aux données pour l'analyse afin de vous assurer que vous pouvez utiliser des données non normales.
Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur vos résultats. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.
Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse.
Les données multimodales ont plusieurs pics. (Un pic représente le mode d'un ensemble de données.) Les données multimodales surviennent généralement lorsque les données sont collectées à partir de plusieurs procédés ou conditions, par exemple, pour plusieurs températures.
Par exemple, ces histogrammes sont des graphiques représentant les mêmes données. L'histogramme simple présente deux pics, mais leur signification n'est pas claire. L'histogramme avec groupes indique que les pics correspondent à deux groupes.
Si des informations supplémentaires vous permettent de classer les observations en groupes, vous pouvez créer une variable de groupe avec ces informations. Vous pouvez ensuite créer le graphique avec des groupes pour déterminer si la variable de groupe explique les pics dans les données.
Pour ajouter une variable de regroupement à un graphique existant, double-cliquez sur la représentation de donnée sur le graphique, puis cliquez sur l'onglet Groupes.
Si votre histogramme comporte une ligne de distribution ajustée, évaluez la distance à laquelle les hauteurs des barres suivent la forme de la ligne. Si les barres suivent étroitement la ligne de distribution ajustée, les données s'ajustent correctement à la loi de distribution.
Pour obtenir des informations sur la spécification de différents paramètres et lois de distribution, reportez-vous à la rubrique Lignes de distribution ajustées.
Pour mesurer plus précisément l'ajustement de la loi de distribution, utilisez un diagramme de probabilité pour vérifier la signification statistique de l'ajustement.
Si votre histogramme comporte des groupes, évaluez et comparez le centrage et la dispersion des groupes.
Recherchez des différences entre les centres des groupes.
Recherchez les différences entre les dispersions des groupes.