Une banque demande huit informations aux demandeurs de prêt : revenus, niveau de formation, âge, ancienneté à l'adresse actuelle, ancienneté auprès de l'employeur actuel, épargne, endettement et nombre de cartes de crédit. Un administrateur de la banque veut analyser ces données pour déterminer la meilleure façon de les regrouper et d'en faire un rapport. L'administrateur collecte ces informations pour 30 demandeurs de prêt.
Il exécute une corrélation de Pearson pour examiner la puissance et la direction de la relation linéaire qui existe entre chaque paire de variables.
Le diagramme matriciel diagonal vous permet également de voir les valeurs aberrantes qui peuvent considérablement influer sur les résultats. Par exemple, la ligne 6 contient un point de données extrême qui peut influencer la corrélation entre les variables. Le diagramme des crédits et de l'âge présente un exemple de cette situation.
Souvent, plus la corrélation est élevée, plus l'intervalle de confiance est étroit. Par exemple, Cartes crédit et Age ont une faible corrélation et l'intervalle de confiance à 95 % est compris entre –0,468 et 0,242.
Type de corrélation | Pearson |
---|---|
Nombre de lignes utilisées | 30 |
Age | Résidence | Emploi | Epargne | Crédits | |
---|---|---|---|---|---|
Résidence | 0,838 | ||||
Emploi | 0,848 | 0,952 | |||
Epargne | 0,552 | 0,570 | 0,539 | ||
Crédits | 0,032 | 0,186 | 0,247 | -0,393 | |
Cartes crédit | -0,130 | 0,053 | 0,023 | -0,410 | 0,474 |