Une courbe lissée est une ligne qui est ajustée aux données de manière à explorer les relations potentielles entre deux variables, sans ajustement d'un modèle spécifique, comme une droite de régression ou une distribution théorique.

A propos des courbes lissées

Les courbes lissées sont particulièrement utiles lorsque la courbure de la relation ne change pas brusquement. Les courbes lissées ajoutées dans les graphiques sont calculées à l'aide de la méthode de lissage LOWESS.

Nuage de points avec courbe lissée

Dans ce diagramme de série chronologique, l'une des courbes lissées est pleine tandis que l'autre est en pointillés.

Diagramme de série chronologique avec courbes lissées pour chaque groupe
Paramètres de lissage LOWESS
Degré de lissage
Vous pouvez saisir des valeurs comprises entre 0 et 1. Un facteur de lissage fonctionne généralement mieux lorsque la fraction (f) de points est suffisamment importante pour produire une courbe lisse sans déformer la relation sous-jacente entre les variables. Cleveland1 suggère d'utiliser une valeur de f aussi grande que possible tout en conservant les données s'écartant de la relation dans un graphique de lissage à part, présentant les valeurs résiduelles Y en fonction des valeurs X.
Nombre d'étapes
Pour limiter l'influence des valeurs aberrantes sur les valeurs Y lissées, vous pouvez définir le nombre d'itérations de lissage. Vous pouvez entrer des valeurs comprises entre 0 et 10. Chaque étape réduit la contribution des valeurs aberrantes dans l'itération suivante de la régression linéaire pondérée, en fonction de la taille des valeurs résiduelles à l'étape précédente du lissage. D'après Cleveland, deux étapes robustes suffisent pour lisser correctement les effets des valeurs aberrantes pour la plupart des données.

Ajouter une courbe lissée lors de la création d'un graphique

Procédez comme suit pour inclure une courbe lissée lorsque vous créez l'un des graphiques suivants :
  • Nuage de points
  • Graphique matriciel diagonal
  • Diagramme de série chronologique
  • Histogramme
  1. Dans la boîte de dialogue de création du graphique, cliquez sur Visualisation des données.
  2. Cliquez sur Facteur de lissage.
  3. Cliquez sur Courbe lissée.
  4. (Facultatif) Dans Degré de lissage, entrez un nombre compris entre 0 et 1 pour la fraction du nombre total de points à utiliser afin de calculer les valeurs ajustées pour chaque valeur de X. La valeur par défaut est 0.5. Lorsque le degré de lissage est faible, la courbe lissée épouse les variations localisées dans les données. Lorsque le facteur de lissage est élevé, la courbe lissée suit la tendance générale des données.
  5. (Facultatif) Dans Nombre d'étapes, entrez un nombre compris entre 0 et 10 afin de définir le nombre d'itérations de lissage à utiliser pour limiter l'effet des valeurs aberrantes. Chaque étape réduit la pondération attribuée aux valeurs aberrantes dans l'itération suivante. La valeur par défaut est 2.
  6. Cliquez sur OK.

Ajout d'une courbe lissée dans un graphique

Vous pouvez ajouter une courbe lissée LOWESS dans les nuages de points, les graphiques matriciels diagonaux, les histogrammes et les diagrammes de séries chronologiques.

  1. Double-cliquez sur le graphique.
  2. Cliquez avec le bouton droit de la souris et sélectionnez Ajouter > Facteur de lissage.
  3. (Facultatif) Dans Degré de lissage, entrez un nombre compris entre 0 et 1 pour la fraction du nombre total de points à utiliser afin de calculer les valeurs ajustées pour chaque valeur de X. La valeur par défaut est 0.5. Lorsque le degré de lissage est faible, la courbe lissée épouse les variations localisées dans les données. Lorsque le facteur de lissage est élevé, la courbe lissée suit la tendance générale des données.
  4. (Facultatif) Dans Nombre d'étapes, entrez un nombre compris entre 0 et 10 afin de définir le nombre d'itérations de lissage à utiliser pour limiter l'effet des valeurs aberrantes. Chaque étape réduit la pondération attribuée aux valeurs aberrantes dans l'itération suivante. La valeur par défaut est 2.
  5. Cliquez sur OK.

Modifier une courbe lissée dans un graphique

Lorsque vous avez ajouté une courbe lissée dans un graphique, vous pouvez en changer la couleur, la taille, le type et les paramètres.

  1. Double-cliquez sur le graphique.
  2. Double-cliquez sur la courbe lissée à modifier. Pour plus d'informations sur la sélection de courbes lissées, accédez à la rubrique Sélection de groupes et d'éléments isolés dans un graphique.
  3. Sélectionnez l'onglet adapté pour les modifications que vous voulez apporter.
    • Attributs : modifiez la couleur, la taille et le type de la ligne.
    • Groupes : affectez des attributs à l'aide d'une variable de groupement.
    • Options : modifiez le degré de lissage et le nombre d'étapes pour le facteur de lissage.
  4. Cliquez sur OK.

Méthode de lissage LOWESS

La méthode de lissage LOWESS est une technique fréquemment utilisée pour déterminer une ligne de lissage. LOWESS signifie locally-weighted scatterplot smoother (nuage de points localement pondéré lissé). Vous pouvez également spécifier des paramètres pour modifier le degré de lissage et l'effet des valeurs aberrantes.

La routine de la courbe lissée calcule une nouvelle valeur Y lissée pour chaque valeur X.

  1. La méthode sélectionne une fraction (par défaut, f = 0,5) de tous les points, en retenant les données dont la valeur X est la plus proche de celle d'un point (X,Y) donné, de part et d'autre de ce dernier. Cette fraction est appelée degré de lissage. Cette méthode entraîne souvent la sélection d'un plus grand nombre de points d'un côté de la valeur X que de l'autre. L'exemple suivant représente la fraction de données sélectionnées pour un point spécifique. La zone ombrée contient la fraction (0,5) des données les plus proches du point en rouge.

  2. Minitab calcule les pondérations à l'aide de la distance X entre chaque point dans la fraction sélectionnée et le point à lisser :

    Le graphique suivant indique la relation entre les pondérations (axe vertical) les valeurs X (axe horizontal) pour la fraction de points sélectionnés. Les points les plus proches de chaque valeur X contribuent le plus au lissage.

  3. Minitab réalise un régression linéaire pondérée sur tous les points de la fraction de données sélectionnée, en utilisant les pondérations de l'étape 2 pour générer une valeur lissée initiale.

  4. Enfin, Minitab limite l'influence des valeurs aberrantes sur les résultats en utilisant d'autres itérations (par défaut n = 2) de l'étape 3, avec de nouvelles pondérations calculées comme suit :

1 W.S. Cleveland (1979). "Robust locally weighted regression and smoothing scatterplots," Journal of the American Statistical Association, 74, 829-836.