Exemple pour Corrélation

Une banque demande huit informations aux demandeurs de prêt : revenus, niveau de formation, âge, ancienneté à l'adresse actuelle, ancienneté auprès de l'employeur actuel, épargne, endettement et nombre de cartes de crédit. Un administrateur de la banque veut analyser ces données pour déterminer la meilleure façon de les regrouper et d'en faire un rapport. L'administrateur collecte ces informations pour 30 demandeurs de prêt.

Il exécute une corrélation de Pearson pour examiner la puissance et la direction de la relation linéaire qui existe entre chaque paire de variables.
  1. Ouvrez le fichier de données échantillons, DemandeurPrêt.MTW.
  2. Sélectionnez .Stat > Statistiques élémentaires > Corrélation
  3. Dans la zone Variables, saisissez Age Résidence Emploi Epargne Crédits 'Cartes crédit'.
  4. Cliquez sur Graphiques.
  5. Dans la zone Statistiques à afficher sur un diagramme, sélectionnez Corrélations et intervalles.
  6. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Utilisez le diagramme matriciel diagonal pour évaluer visuellement la relation entre chaque combinaison de variables. Les relations peuvent être linéaires, monotones ou ni l'un ni l'autre.
  • Le coefficient de corrélation de Pearson le plus élevé se situe entre Emploi et Résidence. La valeur de 0,952 indique une relation positive entre les variables. Plus la variable Emploi est élevée, plus la résidence l'est aussi. L'intervalle de confiance à 95 % est compris entre 0,901 et 0,977.
  • Le coefficient de corrélation de Pearson entre Cartes crédit et Epargne est de –0,410. Plus le nombre de cartes de crédit augmente, plus l'épargne diminue. L'intervalle de confiance à 95 % est compris entre –0,671 et –0,059.

Le diagramme matriciel diagonal vous permet également de voir les valeurs aberrantes qui peuvent considérablement influer sur les résultats. Par exemple, la ligne 6 contient un point de données extrême qui peut influencer la corrélation entre les variables. Le diagramme des crédits et de l'âge présente un exemple de cette situation.

Souvent, plus la corrélation est élevée, plus l'intervalle de confiance est étroit. Par exemple, Cartes crédit et Age ont une faible corrélation et l'intervalle de confiance à 95 % est compris entre –0,468 et 0,242.

Corrélation : Age; Résidence; Emploi; Epargne; Crédits; Cartes crédit

Méthode

Type de corrélationPearson
Nombre de lignes utilisées30

Corrélation

AgeRésidenceEmploiEpargneCrédits
Résidence0,838       
Emploi0,8480,952     
Epargne0,5520,5700,539   
Crédits0,0320,1860,247-0,393 
Cartes crédit-0,1300,0530,023-0,4100,474