Le dendrogramme est une arborescence qui affiche les groupes formés par le regroupement des observations à chaque étape et leurs niveaux de similarité. Le niveau de similarité est mesuré le long de l'axe vertical (alternativement, vous pouvez afficher le niveau de distance) et les différentes observations sont répertoriées le long de l'axe horizontal.

Interprétation

Utilisez le dendrogramme pour visualiser le mode de formation des groupes à chaque étape et pour évaluer les niveaux de similarité (ou de distance) des groupes formés.

Pour visualiser les niveaux de similarité (ou de distance), positionnez le pointeur de la souris sur une ligne horizontale du dendrogramme. La configuration de variation des valeurs de similarité ou de distance d'une étape à une autre peut vous aider à sélectionner le groupement final pour vos données. L'étape comportant un changement brusque des valeurs peut correspondre à un point intéressant pour définir le groupement final.

On désigne également le choix du regroupement final par l'expression "couper le dendrogramme". Couper le dendrogramme revient à tracer une ligne à travers le dendrogramme pour spécifier le groupement final. Vous pouvez également comparer différents groupements finaux dans les dendrogrammes pour déterminer le plus logique pour vos données.

Ce dendrogramme a été créé avec une subdivision finale de 4 groupes, ce qui se produit à un niveau de similarité d'environ 40. Le premier groupe (à l'extrémité gauche) est composé de sept observations (observations des lignes 1, 3, 6, 9, 10, 11 et 15 de la feuille de travail). Le deuxième groupe, à sa droite, est composé de 3 observations (observations des lignes 4, 12 et 19 de la feuille de travail). Le troisième groupe est composé de 7 observations (observations des lignes 2, 14, 17, 20, 18, 5 et 8). Le quatrième groupe, à l'extrémité droite, est composé de 3 observations (observations des lignes 7, 13 et 16). Si vous coupiez le dendrogramme plus haut, les groupes finaux seraient moins nombreux, mais le niveau de similarité serait réduit. Si vous coupiez le dendrogramme plus bas, le niveau de similarité serait supérieur, mais les groupes finaux seraient plus nombreux.

Remarque

Pour certains fichiers de données, les méthodes moyenne, centroïde, médiane et Ward peuvent ne pas produire de dendrogramme hiérarchique. Autrement dit, les distances de fusion n'augmentent pas automatiquement après chaque étape. Dans le dendrogramme, cela produit une liaison descendante et non ascendante.