Qu'est-ce que la covariance ?

La covariance mesure la relation linéaire entre deux variables. La covariance est similaire à la corrélation entre deux variables, cependant elle est différente pour les raisons suivantes :
  • Les coefficients de corrélation sont normalisés. Ainsi, une relation linéaire parfaite correspond à un coefficient de 1. La corrélation mesure la force et la direction de la relation linéaire entre deux variables.
  • Les valeurs de covariance ne sont pas normalisées. Par conséquent, la covariance peut s'étendre de moins l'infini à plus l'infini. Par conséquent, la valeur d'une relation linéaire parfaite dépend des données. Comme les données ne sont pas normalisées, il est difficile de déterminer la force de la relation entre deux variables.

Vous pouvez utiliser la covariance pour comprendre la direction d'une relation entre deux variables. Des valeurs de covariance positives indiquent que les valeurs supérieures à la moyenne d'une variable sont associées aux valeurs supérieures à la moyenne de l'autre variable et que les valeurs inférieures à la moyenne sont associées de façon similaire. Des valeurs de covariance négatives indiquent que les valeurs supérieures à la moyenne d'une variable sont associées aux valeurs inférieures à la moyenne de l'autre variable.

Le coefficient de corrélation est une fonction de la covariance. Il est égal à la covariance divisée par le produit des écarts types des variables. Une covariance positive a donc toujours pour résultat une corrélation positive et de la même façon, une covariance négative a toujours pour résultat une corrélation négative.