Interprétation des résultats principaux pour la fonction Histogramme

Suivez les étapes ci-dessous pour interpréter un histogramme.

Etape 1 : Evaluer les caractéristiques clés

Examinez les pics et la dispersion de la loi de distribution. Evaluez l'impact de l'effectif de l'échantillon sur l'apparence de l'histogramme.

Pics et dispersion

Identifiez les pics, qui correspondent aux groupes de barres les plus hautes. Les pics représentent les valeurs les plus courantes. Evaluez la dispersion de l'échantillon pour comprendre la variation des données.

Par exemple, dans cet histogramme des temps d'attente des clients, le pic des données survient au bout de 6 minutes. La dispersion des données s'étend de 2 à 12 minutes environ.

Examinez toute caractéristique surprenante ou indésirable dans l'histogramme. Par exemple, l'histogramme des temps d'attente des clients indique une dispersion plus étendue que prévu. Une étude a révélé qu'une mise à jour logicielle sur les ordinateurs a entraîné des retards dans les temps d'attente des clients.

Effectif d'échantillon (n)

L'effectif de l'échantillon peut avoir une incidence sur l'apparence du graphique.

Par exemple, bien que ces histogrammes semblent plutôt différents, les deux ont été créés à l'aide d'échantillons de données sélectionnés aléatoirement dans la même population.
n = 20
n = 100

Une histogramme est adapté lorsque l'effectif de l'échantillon est d'au moins 20. Si l'effectif de l'échantillon est trop petit, chaque barre de l'histogramme peut ne pas contenir suffisamment de points de données pour afficher avec précision leur distribution. Plus l'échantillon est important, plus l'histogramme ressemble à la forme de la distribution de la population. Si l'effectif d'échantillon est inférieur à 20, envisagez plutôt d'utiliser un diagramme des valeurs individuelles.

Etape 2 : Rechercher des indicateurs de données non normales ou aberrantes

Des données asymétriques et multimodales peuvent indiquer la présence de données non normales. Des valeurs aberrantes peuvent indiquer la présence d'autres conditions dans vos données.

Données asymétriques

Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. L'asymétrie indique que les données peuvent ne pas être normalement distribuées.

Ces histogrammes illustrent des données asymétriques. L'histogramme avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. L'histogramme avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Asymétrie à droite
Asymétrie à gauche

Si vous savez que vos données ne sont pas naturellement asymétriques, étudiez-en les causes possibles. Pour analyser les données très asymétriques, consultez la rubrique sur les observations relatives aux données pour l'analyse afin de vous assurer que vous pouvez utiliser des données non normales.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur vos résultats. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur un histogramme, des barres isolées aux extrémités indiquent des valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse.

Données multimodales

Les données multimodales ont plusieurs pics. (Un pic représente le mode d'un ensemble de données.) Les données multimodales surviennent généralement lorsque les données sont collectées à partir de plusieurs procédés ou conditions, par exemple, pour plusieurs températures.

Par exemple, ces histogrammes sont des graphiques représentant les mêmes données. L'histogramme simple présente deux pics, mais leur signification n'est pas claire. L'histogramme avec groupes indique que les pics correspondent à deux groupes.

Simple
Avec groupes

Si des informations supplémentaires vous permettent de classer les observations en groupes, vous pouvez créer une variable de groupe avec ces informations. Vous pouvez ensuite créer le graphique avec des groupes pour déterminer si la variable de groupe explique les pics dans les données.

Conseil

Pour ajouter une variable de regroupement à un graphique existant, double-cliquez sur la représentation de donnée sur le graphique, puis cliquez sur l'onglet Groupes.

Etape 3 : Evaluer l'ajustement d'une loi de distribution

Si votre histogramme comporte une ligne de distribution ajustée, évaluez la distance à laquelle les hauteurs des barres suivent la forme de la ligne. Si les barres suivent étroitement la ligne de distribution ajustée, les données s'ajustent correctement à la loi de distribution.

Remarque

Pour obtenir des informations sur la spécification de différents paramètres et lois de distribution, reportez-vous à la rubrique Lignes de distribution ajustées.

Ajustement correct
Ajustement incorrect

Pour mesurer plus précisément l'ajustement de la loi de distribution, utilisez un diagramme de probabilité pour vérifier la signification statistique de l'ajustement.

Étape 4 : Évaluer et comparer des groupes

Si votre histogramme comporte des groupes, évaluez et comparez le centrage et la dispersion des groupes.

Centres

Recherchez des différences entre les centres des groupes.

Par exemple, ces histogrammes indiquent le délai de traitement pour trois versions d'une demande de carte de crédit. Le centre pour chaque version de la demande de carte de crédit se trouve à un emplacement différent. Les différences d'emplacements indiquent que les délais de traitement moyens sont différents.
Histogrammes superposés
Panneau d'histogrammes
Pour savoir si une différence dans les moyennes est statistiquement significative, effectuez l'une des opérations suivantes :

Dispersions

Recherchez les différences entre les dispersions des groupes.

Par exemple, ces histogrammes indiquent les poids de bocaux qui ont été remplies par trois machines. Bien que ces histogrammes présentent à peu près le même centrage, certains sont plus larges que d'autres et leur dispersion est plus étendue. La dispersion plus étendue indique que ces machines remplissent les bocaux de façon moins régulière.
Histogrammes superposés
Panneau d'histogrammes
Pour savoir si une différence de dispersion (variance) est statistiquement significative, effectuez l'une des opérations suivantes :