Entrée des données pour la fonction Analyse des composantes principales

Stat > Multivariée > Composantes principales

Indiquez les données pour l'analyse, saisissez le nombre de composantes à calculer et précisez le type de matrice.

Entrée des données

Dans la zone Variables, indiquez les colonnes de données à analyser. Vous devez disposer d'au moins deux colonnes de données numériques, chaque colonne représentant une mesure différente. Si une valeur manquante figure dans une colonne, Minitab ignore toute la ligne. Minitab exclut les valeurs manquantes du calcul de la matrice de corrélation ou de covariance.

Dans cette feuille de travail, chaque colonne contient des mesures correspondant à un type différent d'informations pour une demande de prêt.

C1 C2 C3 C4 C5 C6 C7 C8
Salaire Education Age Résidence Emploi Epargne Crédits Cartes crédit
50000 16 28 2 2 5000 1200 2
72000 18 35 10 8 12000 5400 4
61000 18 36 6 5 15000 1000 2
88000 20 35 4 4 980 1100 4
91100 18 38 8 9 20000 0 1
45100 14 41 15 14 3900 22000 4

Nombre de composantes à calculer

Indiquez le nombre de composantes principales que Minitab doit calculer. Si vous avez un nombre élevé de variables, vous pouvez spécifier un plus petit nombre de composantes afin de réduire la quantité de résultats. Si vous ne savez pas combien de composantes saisir, vous pouvez laisser le champ vide. En l'absence de valeur, Minitab calcule le nombre maximal de composantes, qui est égal au nombre de variables. Vous pouvez ensuite utiliser les résultats pour déterminer combien de composantes représentent la majeure partie de la variation dans les variables initiales.

Type de matrice

Sélectionnez le type de matrice à utiliser pour calculer les composantes principales.

  • Corrélation : utilisez cette option lorsque les variables ont différentes échelles et que vous souhaitez attribuer la même pondération à toutes les variables. Par exemple, si certaines variables utilisent une échelle allant de 1 à 5 et que d'autres utilisent une échelle allant de 1 à 10, utilisez la matrice de corrélation pour normaliser les échelles.
  • Covariance : utilisez cette option lorsque les variables utilisent la même échelle, ou lorsqu'elles ont des échelles différentes, mais que vous souhaitez accorder plus d'importance aux variables ayant des variances plus élevées.

Par exemple, supposons que vous disposez de différentes espèces d'organismes sur plusieurs sites d'échantillon. Si vous sélectionnez la matrice de covariance, les espèces les plus communes présenteront des variances plus élevées et une plus grande importance leur sera accordée. Les espèces très rares n'auront pas autant d'incidence sur l'analyse. Si vous sélectionnez une matrice de corrélation, toutes les espèces sont pondérées de manière égale. Par conséquent, les espèces très rares peuvent contribuer de manière significative aux résultats de l'analyse. La décision dépend donc de l'objectif de votre étude.