Qu'est-ce qu'une méthode non paramétrique ?

Un test non paramétrique est un test d'hypothèse qui n'exige pas que la distribution de la population soit caractérisée par certains paramètres. Par exemple, de nombreux tests d'hypothèse supposent que la population obéit à une loi normale pour les paramètres µ et σ. Comme les tests non paramétriques ne partent pas de cette hypothèse, ils s'avèrent utiles lorsque vos données sont fortement non normales ou résistantes à la transformation.

Dans le domaine des statistiques paramétriques, on suppose que les échantillons obéissent à des lois de distribution entièrement spécifiées, caractérisées par un ou plusieurs paramètres inconnus sur lesquels on veut réaliser des inférences. Avec une méthode non paramétrique, on suppose que la loi parent de l'échantillon est indéterminée et l'on cherche souvent à réaliser des inférences sur le centre de cette loi. Par exemple, de nombreux tests statistiques paramétriques, tels que le test t à 1 échantillon, partent de l'hypothèse que les données sont issues d'une population normale dont la moyenne est inconnue. Dans une étude non paramétrique, l'hypothèse de normalité est supprimée.

Les méthodes non paramétriques sont utiles lorsque l'hypothèse de normalité ne tient pas et que l'effectif d'échantillon est faible. Cela dit, dans les tests non paramétriques, vos données reposent également sur des hypothèses. Par exemple, il est essentiel de supposer que les observations des échantillons sont indépendantes et obéissent à la même loi. De même, dans les plans à deux échantillons, il est nécessaire de supposer que la forme et la dispersion des lois est similaire.

Par exemple, les données salariales sont particulièrement asymétriques à droite, de nombreux employés gagnant des salaires modestes tandis que seuls certains d'entre eux gagnent des salaires élevés. Vous pouvez utiliser des tests non paramétriques avec ces données afin de répondre à des questions du type :
  • Le salaire médian dans votre entreprise est-il égal à une certaine valeur ? Utilisez le test du signe à 1 échantillon.
  • Le salaire médian dans une succursale bancaire urbaine est-il supérieur au salaire médian dans une succursale bancaire rurale ? Utilisez le test de Mann-Whitney ou de Kruskal-Wallis.
  • Les salaires médians sont-ils différents dans les succursales d'une banque située en zone rurale, en zone urbaine et en banlieue ? Utilisez le test de Mood pour les médianes.
  • De quelle manière le niveau d'instruction influe-t-il sur les succursales rurale et urbaine ? Utilisez le test de Friedman.

Limites des tests non paramétriques

Les tests non paramétriques présentent les limites suivantes :
  • Les tests non paramétriques sont généralement moins puissants que leurs équivalents paramétriques quand l'hypothèse de normalité est vérifiée. Ainsi, vous avez moins de chances de rejeter l'hypothèse nulle lorsqu'elle est fausse si les données obéissent à une loi normale.
  • Ces tests requièrent souvent la modification des hypothèses. Par exemple, la plupart des tests non paramétriques relatifs au centre de la population utilisent la médiane au lieu de la moyenne. Le test ne répond pas à la même question que la procédure paramétrique correspondante si la population n'est pas symétrique.

Tests paramétriques équivalents

Lorsque vous pouvez choisir entre une procédure paramétrique et une procédure non paramétrique et que vous êtes relativement certain que les hypothèses de la procédure paramétrique sont satisfaites, utilisez la procédure paramétrique. Vous pouvez également utiliser la procédure paramétrique lorsque la population n'est pas normalement distribuée, pour peu que l'effectif d'échantillon soit suffisamment important.

Le tableau suivant est une liste des tests non paramétriques et de leurs alternatives paramétriques.

Tests non paramétriques : Test paramétrique équivalent
Test des signes à 1 échantillon Test Z à 1 échantillon, test t à 1 échantillon
Test de Wilcoxon à 1 échantillon Test Z à 1 échantillon, test t à 1 échantillon
Test de Mann-Whitney Test t à 2 échantillon
Test de Kruskal-Wallis ANOVA à un facteur contrôlé
Test de Mood pour les médianes ANOVA à un facteur contrôlé
Test de Friedman ANOVA à deux facteurs contrôlés