Interprétation des résultats principaux pour la fonction Diagramme à points

Suivez les étapes ci-dessous pour interpréter un diagramme à points.

Etape 1 : Evaluer les caractéristiques clés

Examinez les pics et la dispersion de la loi de distribution. Evaluez l'incidence de l'effectif de l'échantillon sur l'apparence du diagramme à points.

Pics et dispersion

Identifiez les pics, qui sont les repères contenant le plus de points. Les pics représentent les valeurs les plus courantes dans l'échantillon. Evaluez la dispersion de l'échantillon pour comprendre la variation des données.

Par exemple, dans ce diagramme à points des temps d'attente des clients, le pic des données survient au bout de 6 minutes. La dispersion des données s'étend de 3,5 minutes à 8,5 minutes environ.

Examinez toute caractéristique surprenante ou indésirable dans le diagramme à points. Par exemple, le diagramme à points des temps d'attente des clients indique une dispersion plus étendue que prévu. Une étude a révélé qu'une mise à jour logicielle sur les ordinateurs a provoqué une certaine instabilité et des retards dans les temps d'attente des clients.

Effectif d'échantillon (n)

L'effectif de l'échantillon peut avoir une incidence sur l'apparence du graphique.

Par exemple, bien que ces diagrammes à points semblent plutôt différents, les deux ont été créés à l'aide d'échantillons de données sélectionnés aléatoirement dans la même population. Sur le premier diagramme à points, chaque symbole représente une observation. Sur le second diagramme à points, chaque symbole représente jusqu'à trois observations.
n = 20
n = 100

Le diagramme à points est adapté lorsque l'effectif de l'échantillon est inférieur à 50 environ. Si l'effectif de l'échantillon est supérieur ou égal à 50, un point peut représenter plusieurs observations. Envisagez d'utiliser une boîte à moustaches ou un histogramme en plus du diagramme à points afin d'identifier plus facilement les principales caractéristiques de la loi de distribution.

Etape 2 : Rechercher des indicateurs de données non normales ou aberrantes

Des données asymétriques et multimodales peuvent indiquer la présence de données non normales. Des valeurs aberrantes peuvent indiquer la présence d'autres conditions dans vos données.

Données asymétriques

Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. L'asymétrie indique que les données peuvent ne pas être normalement distribuées. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Ces diagrammes à points illustrent des données asymétriques. Le diagramme à points avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. Le diagramme à points avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Asymétrie à droite
Asymétrie à gauche

Si vous savez que vos données ne sont pas naturellement asymétriques, étudiez-en les causes possibles. Pour analyser les données très asymétriques, consultez la rubrique sur les observations relatives aux données pour l'analyse afin de vous assurer que vous pouvez utiliser des données non normales.

Valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur vos résultats. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur un diagramme à points, les valeurs de données anormalement élevées ou faibles indiquent de possibles valeurs aberrantes.
Conseil

Maintenez le pointeur sur la valeur aberrante pour identifier le point de donnée.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Pensez éventuellement à supprimer les valeurs de données associées à des événements anormaux et uniques (causes spéciales). Ensuite, répétez l'analyse.

Données multimodales

Les données multimodales ont plusieurs pics. (Un pic représente le mode d'un ensemble de données.) Les données multimodales surviennent généralement lorsque les données sont collectées à partir de plusieurs procédés ou conditions, par exemple, pour plusieurs températures.

Par exemple, ces diagrammes à points sont des graphiques représentant les mêmes données. Le diagramme à points simple comporte deux pics, mais leur signification n'est pas claire. Le diagramme à points avec groupes indique que les pics correspondent à deux groupes.

Simple
Avec groupes

Si des informations supplémentaires vous permettent de classer les observations en groupes, vous pouvez créer une variable de groupe avec ces informations. Vous pouvez ensuite créer le graphique avec des groupes pour déterminer si la variable de groupe explique les pics dans les données.

Conseil

Pour ajouter une variable de regroupement à un graphique existant, double-cliquez sur la représentation de donnée sur le graphique, puis cliquez sur l'onglet Groupes.

Étape 3 : Évaluer et comparer des groupes

Si votre diagramme à points comporte des groupes, évaluez et comparez le centrage et la dispersion des groupes.

Centres

Recherchez des différences entre les centres des groupes.

Ces diagrammes à points indiquent par exemple le délai de traitement pour quatre versions d'une demande de carte de crédit. Le centre pour chaque version de la demande de carte de crédit se trouve à un emplacement différent. Les différences d'emplacements indiquent que les délais de traitement sont différents.
Diagrammes à points en panneau
Diagrammes à points empilés
Pour savoir si une différence dans les moyennes est statistiquement significative, effectuez l'une des opérations suivantes :

Dispersions

Recherchez les différences entre les dispersions des groupes.

Ces diagrammes à points indiquent par exemple les poids de bocaux remplis par trois machines. Bien que ces diagrammes à points aient à peu près le même centre, certains diagrammes sont plus larges que d'autres et leur dispersion est plus étendue. La dispersion plus étendue indique que ces machines remplissent les bocaux de façon moins régulière.
Diagrammes à points en panneau
Diagrammes à points empilés
Pour savoir si une différence de dispersion (variance) est statistiquement significative, effectuez l'une des opérations suivantes :