Analyse des composantes principales - Généralités

Utilisez la fonction Analyse des composantes principales pour définir un nombre plus petit de variables non corrélées, nommées « composantes principales », à partir d'un grand ensemble de données. Cette analyse vous permet de créer des variables (composantes principales) qui sont des combinaisons linéaires des variables observées. L'objectif de l'analyse en composantes principales est de représenter la plus grande partie de la variance par le plus petit nombre de composantes principales.

Par exemple, un analyste utilise une analyse en composantes principales pour étudier les réponses des clients concernant plusieurs caractéristiques d'un nouveau shampooing. Il souhaite déterminer s'il est possible de former un nombre réduit de variables non corrélées qui soient plus faciles à interpréter et à analyser que les variables observées qui ont été mesurées.

L'analyse en composantes principales est utilisée généralement comme une étape dans une série d'analyse. Par exemple, vous pouvez utiliser des composantes principales avant une analyse de régression afin d'éviter la multicolinéarité ou de réduire le nombre de prédicteurs par rapport au nombre d'observations.

Où trouver cette analyse ?

Pour effectuer une analyse en composantes principales, sélectionnez Stat > Multivariée > Composantes principales.

Quand utiliser une autre analyse ?

Pour modéliser chaque variable observée comme une fonction linéaire de facteurs, utilisez la fonction Analyse factorielle. L'analyse factorielle traduit la covariance entre les variables en un certain nombre de facteurs non observables (latents).