Spécifiez les données pour votre analyse, sélectionnez les méthodes de liaison et de distance, indiquez si les variables doivent être normalisées, spécifiez la subdivision finale et sélectionnez les options de graphiques.
Dans Matrice de distance ou variables, entrez les colonnes contenant les données de mesure ou une matrice de distance stockée contenant les distances entre toutes les paires d'observations.
Si vous entrez une matrice de distance stockée, Minitab ne peut pas calculer de statistiques pour la subdivision finale.
Pour les données de mesure, vous devez disposer d'au moins deux colonnes numériques, chaque colonne représentant une mesure différente. Avant d'effectuer cette analyse, vous devez supprimer de la feuille de travail les lignes contenant des données manquantes. Si vous disposez de plusieurs lignes de données, vous pouvez diviser la feuille de travail en sous-ensembles pour exclure les lignes ayant des valeurs manquantes. Pour plus d'informations, reportez-vous à la rubrique Division de la feuille de travail en sous-ensembles - Généralités.
Vous ne pouvez pas indiquer de variable de catégorie pour cette analyse. Si vous disposez d'une variable de catégorie, vous devez d'abord convertir les valeurs de texte vers une échelle numérique, ou effectuer une analyse à part pour chaque niveau de la variable de catégorie. Pour plus d'informations, reportez-vous à la rubrique Observations relatives aux données pour la fonction Observations en groupes.
Pour une matrice de distance stockée, l'entrée dans la cellule à l'intersection de la ligne i et de la colonne j de la matrice de distance D correspond à la distance entre les observations i et j. Pour obtenir des informations sur la création et l'utilisation des matrices stockées dans Minitab, reportez-vous à la rubrique Matrices - Généralités.
C1 | C2 | C3 | C4 |
---|---|---|---|
Sexe | Taille | Poids | Droitier/Gaucher |
2 | 67 | 155 | 1 |
1 | 74 | 193 | 1 |
2 | 68 | 152 | 1 |
1 | 70 | 172 | 0 |
1 | 72 | 169 | 1 |
2 | 66 | 134 | 0 |
Dans Méthode de liaison, sélectionnez une méthode pour indiquer comment est définie la distance entre deux groupes. Vous pouvez essayer d'utiliser différentes méthodes de liaison pour déterminer laquelle apporte les résultats les plus utiles pour vos données.
Pour la fonction Observations en groupes, la distance fait référence à la distance séparant les observations, et la liaison fait référence à la distance séparant les groupes d'observations. Pour la fonction Variables de groupes, la distance fait référence à la distance séparant les variables, et la liaison fait référence à la distance séparant les groupes de variables.
Si vous avez sélectionné Moyenne, Centré, Médiane ou Ward en tant que méthode de liaison, vous devez généralement utiliser l'une des mesures de distance quadratique.
Sélectionnez Normaliser les variables pour que Minitab pondère équitablement toutes les variables. Dans la plupart des cas, la normalisation est recommandée, tout particulièrement lorsque les variables utilisent des échelles différentes. Supposons que la variable A soit sur une échelle en dollars allant de 0 $ à 10 000 000 $, et que la variable B corresponde à un rapport sur une échelle allant de 0,0 à 1,0. Si les variables ne sont pas normalisées, la procédure de regroupement des observations place bien plus de poids sur la variable A que sur la variable B car ses valeurs sont plus élevées, ce qui n'est probablement pas le résultat souhaité. Les variables doivent donc être normalisées.
Lorsque vous normalisez les variables, Minitab égalise toutes les moyennes à 0 et toutes les variances à 1. Pour égaliser uniquement les variances, ne sélectionnez pas l'option de normalisation, mais sélectionnez plutôt l'option Pearson ou Quadratique de Pearson sous Mesure de distance.
Pour obtenir les meilleurs résultats possibles, vos critères doivent être flexibles. Par exemple, si vous définissez la subdivision finale à l'aide du nombre de groupes, vous devez également prendre en compte les changements dans le niveau de similarité. Une baisse marquée de la similarité lors de l'ajout d'un groupe particulier peut vous inciter à spécifier la subdivision finale avant ce regroupement. Inversement, si vous définissez la subdivision finale à l'aide du niveau de similarité, il se peut que vous déterminiez que les niveaux de similarité ne changent pas beaucoup sur une étendue de groupes. Par souci de simplicité, il est recommandé de choisir l'étape comportant le moins de groupes.
Si vous ne savez pas quelle valeur indiquer pour la subdivision finale, effectuez d'abord l'analyse avec le paramètre par défaut (1 groupe dans la subdivision finale). Minitab affiche les résultats pour tous les nombres de groupes possibles. Utilisez ces résultats pour déterminer une valeur à saisir pour la subdivision finale. Ensuite, répétez l'analyse et spécifiez la subdivision finale déterminée. Pour plus d'informations, reportez-vous à la rubrique Déterminer le regroupement final en groupes.
Sélectionnez cette option pour afficher une arborescence indiquant comment les groupes ont été formés à chaque étape de la procédure de fusion. Le dendrogramme permet de visualiser les valeurs de similarité (ou de distance) des groupes à chaque étape.
Pour modifier l'affichage par défaut du dendrogramme, cliquez sur Personnaliser.