Dans la zone Matrice de distance ou variables, entrez les colonnes contenant les données de mesure ou une matrice de distance stockée contenant les distances entre toutes les paires de variables.
Si vous entrez une matrice de distance stockée, Minitab ne peut pas calculer de statistiques pour la subdivision finale.
Pour les données de mesure, vous devez disposer d'au moins deux colonnes numériques, chaque colonne représentant une mesure différente. Avant d'effectuer cette analyse, vous devez supprimer de la feuille de travail les lignes contenant des données manquantes. Si vous disposez de plusieurs lignes de données, vous pouvez diviser la feuille de travail en sous-ensembles pour exclure les lignes avec valeurs manquantes. Pour plus d'informations, reportez-vous à la rubrique Division de la feuille de travail en sous-ensembles - Généralités.
Vous ne pouvez pas indiquer de variable de catégorie pour cette analyse. Si vous disposez d'une variable de catégorie, vous devez d'abord convertir les valeurs de texte vers une échelle numérique, ou effectuer une analyse à part pour chaque niveau de la variable de catégorie. Pour plus d'informations, reportez-vous à la rubrique Observations relatives aux données pour la fonction Variables de groupes.
Pour la matrice de distance stockée, l'entrée dans la cellule à l'intersection de la ligne i et de la colonne j de la matrice de distance D correspond à la distance entre les variables i et j. Pour obtenir des informations sur la création et l'utilisation des matrices stockées dans Minitab, reportez-vous à la rubrique Matrices - Généralités.
C1 | C2 | C3 | C4 | C5 |
---|---|---|---|---|
Journal | Radio | Postes de télévision | Niveau d'alphabétisation | University |
279 | 267 | 227 | 0,98 | 1 |
143 | 112 | 332 | 0,94 | 1 |
9 | 113 | 7 | 0,25 | 0 |
391 | 314 | 566 | 0,99 | 1 |
112 | 48 | 423 | 0,82 | 1 |
67 | 66 | 134 | 0,45 | 0 |
Dans Méthode de liaison, sélectionnez une méthode pour indiquer comment est définie la distance entre deux groupes. Vous pouvez essayer d'utiliser différentes méthodes de liaison pour déterminer laquelle apporte les résultats les plus utiles pour vos données.
Pour la fonction Observations en groupes, la distance fait référence à la distance séparant les observations, et la liaison fait référence à la distance séparant les groupes d'observations. Pour la fonction Variables de groupes, la distance fait référence à la distance séparant les variables, et la liaison fait référence à la distance séparant les groupes de variables.
Pour obtenir les meilleurs résultats possibles, vos critères doivent être flexibles. Par exemple, si vous définissez la subdivision finale à l'aide du nombre de groupes, vous devez également prendre en compte les changements dans le niveau de similarité. Une baisse marquée de la similarité lors de l'ajout d'un groupe particulier peut vous inciter à spécifier la subdivision finale avant ce regroupement. Inversement, si vous définissez la subdivision finale à l'aide du niveau de similarité, il se peut que vous déterminiez que les niveaux de similarité ne changent pas beaucoup sur une étendue de groupes. Par souci de simplicité, il est recommandé de choisir l'étape comportant le moins de groupes.
Si vous ne savez pas quelle valeur indiquer pour la subdivision finale, effectuez d'abord l'analyse avec le paramètre par défaut (1 groupe dans la subdivision finale). Minitab affiche les résultats pour tous les nombres de groupes possibles. Utilisez ces résultats pour déterminer une valeur à saisir pour la subdivision finale. Ensuite, répétez l'analyse et spécifiez la subdivision finale déterminée. Pour plus d'informations, reportez-vous à la rubrique Déterminer le regroupement final en groupes.
Sélectionnez cette option pour afficher une arborescence indiquant comment les groupes ont été formés à chaque étape de la procédure de fusion. Le dendrogramme permet de visualiser les valeurs de similarité (ou de distance) des groupes à chaque étape.
Pour modifier l'affichage par défaut du dendrogramme, cliquez sur Personnaliser.