Qu'est-ce qu'une valeur aberrante ?

Une valeur aberrante est une observation inhabituellement élevée ou basse. Les valeurs aberrantes peuvent avoir un effet disproportionné sur les résultats statistiques, tels que la moyenne, ce qui peut conduire à des interprétations trompeuses. Par exemple, un ensemble de données inclut les valeurs suivantes : 1, 2, 3 et 34. La valeur moyenne, 10, qui est supérieure à la majorité des données (1, 2, 3), est considérablement influencée par le point de données extrême, 34. Dans ce cas, la valeur de la moyenne laisse à penser que les valeurs de données sont plus élevées qu'elles ne le sont vraiment. Il convient d'examiner les valeurs aberrantes car elles peuvent fournir des informations utiles sur les données ou le procédé. Bien souvent, il est plus facile d'identifier les valeurs aberrantes en représentant les données sur un graphique.

Tests pour les valeurs aberrantes

Minitab fournit le test de Grubb et les tests de Dixon qui permettent d’identifier une seule valeur aberrante dans un échantillon. Pour effectuer l’un de ces tests de valeurs aberrantes, choisissez Stat > Statistiques élémentaires > Test des valeurs aberrantes. Pour plus d’informations, consultez Test des valeurs aberrantes - Généralités.

Utilisation de graphiques pour identifier des valeurs aberrantes

Dans les boîtes à moustache, Minitab utilise un astérisque (*) pour identifier des valeurs aberrantes. Ces valeurs aberrantes correspondent à des observations qui se trouvent à au moins 1,5 fois l'étendue interquartile (Q3 - Q1) du bord de la boîte.

Cette boîte à moustache met en évidence deux valeurs aberrantes.

Sur les nuages de points, les points très éloignés des autres sont de possibles valeurs aberrantes.

Ce nuage de points met en évidence une possible valeur aberrante.

Dans certains cas, il est nécessaire d'examiner plusieurs types de graphiques car les valeurs aberrantes visibles sur un graphique peuvent ne pas apparaître aussi clairement sur un autre. La boîte à moustaches et l'histogramme utilisent les mêmes données. La valeur aberrante apparaît clairement sur la boîte à moustaches, mais elle est moins évidente sur l'histogramme.

Causes typiques de valeurs aberrantes

Les causes typiques de valeurs aberrantes sont les suivantes :
Cause Actions possibles
Erreur de saisie de données Corrigez l'erreur et analysez à nouveau les données.
Problème lié au procédé Examinez le procédé afin de déterminer l'origine de la valeur aberrante.
Facteur manquant Déterminez si vous avez omis de prendre en compte un facteur influant sur le processus.
Risque aléatoire Examinez le procédé et la valeur aberrante pour déterminer si celle-ci s'est produite par hasard ; effectuez l'analyse avec et sans la valeur aberrante pour évaluer son impact sur les résultats.