Interprétation des résultats principaux pour la fonction Afficher les statistiques descriptives

Suivez les étapes suivantes pour interpréter l'affichage des statistiques descriptives. Les principaux résultats comprennent N, la moyenne, la médiane, l'écart type et plusieurs graphiques.

Etape 1 : Décrire l'effectif de votre échantillon

Utilisez N pour connaître le nombre d'observations de votre échantillon. Minitab n'inclut pas les valeurs manquantes dans ce dénombrement.

Votre échantillon de données doit être moyen ou important. Les échantillons comportant au moins 20 observations sont souvent appropriés pour représenter la loi de vos données. Toutefois, pour mieux représenter la loi avec un histogramme, certains professionnels recommandent de disposer d'au moins 50 observations. Les échantillons volumineux fournissent également des estimations plus précises des paramètres de procédé, comme la moyenne et l'écart type.

Statistiques

VariableNN*MoyenneErT moyenneEcTypMinimumQ1MédianeQ3Maximum
Couple68021,26470,7787846,4220210162024,7537
Résultat principal : N

Dans ces résultats, vous avez 68 observations.

Etape 2 : Décrire le centre des données

Utilisez la moyenne pour décrire l'échantillon avec une seule valeur qui représente le centre des données. De nombreuses analyses statistiques utilisent la moyenne en tant que mesure standard pour le centre de la loi des données.

La médiane est une autre mesure du centre de la loi. Elle est généralement moins influencée par les valeurs aberrantes que la moyenne. La moitié des valeurs de données est supérieure à la valeur de la médiane, tandis que l'autre moitié des valeurs est inférieure.

La médiane et la moyenne mesurent toutes les deux la tendance centrale. Les valeurs inhabituelles, appelées valeurs aberrantes, peuvent avoir davantage d'impact sur la moyenne que sur la médiane. Si vos données sont symétriques, la moyenne et la médiane sont similaires.
Symétrique
Non symétrique

Pour la loi symétrique, la moyenne (ligne bleue) et la médiane (ligne orange) sont tellement proches qu'il est difficile de distinguer les deux lignes. Toutefois, la loi non symétrique présente un asymétrie vers la droite.

Statistiques

VariableNN*MoyenneErT moyenneEcTypMinimumQ1MédianeQ3Maximum
Couple68021,26470,7787846,4220210162024,7537
Résultats principaux : moyenne et médiane

Dans ces résultats, le couple moyen requis pour retirer un bouchon d'un tube de dentifrice est de 21,265, et le couple médian est de 20. Les données semblent asymétriques à droite, ce qui explique pourquoi la moyenne est supérieure à la médiane.

Etape 3 : Décrire la dispersion des données

Utilisez l'écart type pour déterminer la dispersion des données par rapport à la moyenne. Une valeur d'écart type élevée indique que les données sont dispersées.

Statistiques

VariableNN*MoyenneErT moyenneEcTypMinimumQ1MédianeQ3Maximum
Couple68021,26470,7787846,4220210162024,7537
Résultat principal : EcTyp

Dans ces résultats, l'écart type est 6,422. Avec des données normales, la plupart des observations se répartissent selon 3 écarts types de chaque côté de la moyenne.

Etape 4 : Evaluer la forme et la répartition de votre loi de distribution des données

Utilisez l'histogramme, le diagramme des valeurs individuelles et la boîte à moustaches pour évaluer la forme et la dispersion des données, et pour détecter d'éventuelles valeurs aberrantes.

Examinez la répartition de vos données pour déterminer si elles semblent asymétriques.

Lorsque les données sont asymétriques, la majorité d'entre elles sont situées sur le côté supérieur ou inférieur du graphique. En général, l'asymétrie est plus facile à détecter avec un histogramme ou une boîte à moustaches.

Asymétrie à droite
Asymétrie à gauche

L'histogramme avec des données asymétriques à droite illustre des temps d'attente. La plupart des temps d'attente sont relativement courts, seuls certains sont longs. L'histogramme avec des données asymétriques à gauche représente des données de temps de défaillance. Quelques éléments rencontrent une défaillance immédiatement, mais pour bien plus d'entre eux, elle survient plus tard.

Déterminez la variation de vos données

Evaluez la dispersion des points pour déterminer la variation de votre échantillon. Plus la variation de l'échantillon est importante, plus les points sont dispersés par rapport au centre des données.

Ce diagramme des valeurs individuelles indique que la variation des données qui se trouvent à droite est plus importante que celle des données de gauche.

Recherchez des données multimodales

Les données multimodales présentent plusieurs pics, également appelés modes. Les données multimodales indiquent souvent que des variables importantes ne sont pas encore représentées.

Si des informations supplémentaires vous permettent de classer les observations en groupes, vous pouvez créer une variable de groupe avec ces informations. Vous pouvez ensuite créer le graphique avec des groupes pour déterminer si la variable de groupe explique les pics dans les données.

Simple
Avec groupes

Par exemple, un responsable de banque collecte des données de temps d'attente et crée un histogramme simple. L'histogramme présente deux pics. Après examen, le responsable détermine que le temps d'attente est plus court pour les clients qui encaissent des chèques que pour ceux qui font des demandes de prêt sur valeur domiciliaire. Le responsable ajoute une variable de groupe pour la tâche client, puis crée un histogramme avec des groupes.

Identifiez les valeurs aberrantes

Les valeurs aberrantes, qui sont des valeurs de données très éloignées des autres valeurs de données, peuvent avoir une incidence importante sur les résultats de votre analyse. En général, les valeurs aberrantes sont plus faciles à repérer sur une boîte à moustaches.

Sur une boîte à moustaches, les astérisques (*) indiquent les valeurs aberrantes.

Essayez de déterminer la cause de toutes les valeurs aberrantes. Corrigez les erreurs de mesure ou d’entrée des données. Supprimez éventuellement les valeurs de données associées à des événements anormaux et uniques (aussi appelés causes spéciales). Ensuite, répétez l'analyse. Pour plus d'informations, reportez-vous à la rubrique Identification des valeurs aberrantes.

Etape 5 : Comparer les données de différents groupes

SI vous une variable de répartition vous permet de définir des groupes dans vos données, vous pouvez l'utiliser pour analyser vos données par groupe ou niveau de groupe.

Statistiques

VariableMachineNN*MoyenneErT moyenneEcTypMinimumQ1MédianeQ3
Couple136018,66670,7324674,394801015,251721,75
  232024,18751,258397,118521417,52431
VariableMachineMaximum
Couple130
  237

Dans ces résultats, les statistiques récapitulatives sont calculées séparément par machine. Vous pouvez facilement voir les différences au centre et la répartition des données pour chaque machine. Par exemple, la machine 1 a un couple moyen inférieur et moins de variation que la machine 2. Pour déterminer si la différence de moyennes est significative, vous pouvez effectuer un test t à 2 échantillons.