Obtenez des définitions et une interprétation pour chaque statistique fournie dans les résultats des étapes de fusion.

Etape

Numéro de l'étape dans la procédure de fusion permettant de lier les groupes. A chaque étape, un nouveau groupe est lié à un groupe existant et leurs niveaux de similarité et de distance sont calculés.

Nombre de groupes

Nombre de groupes formés à chaque étape du processus de fusion. Avant la première étape, le nombre de groupes correspond au nombre total d'observations (pour les observations en groupes) ou au nombre total de variables (pour les variables de groupes). Lors de la première étape, deux groupes sont liés pour en former un nouveau. A chaque étape suivante, un autre groupe est lié à un groupe existant pour former un nouveau groupe. Lors de la dernière étape, toutes les observations ou variables sont combinées en un seul groupe.

Vous pouvez entrer le nombre de groupes dans la boîte de dialogue principale pour spécifier la subdivision finale de vos données. La méthode de liaison et la mesure de distance choisies influencent considérablement les résultats du regroupement.

Niveau de similarité

Pourcentage de la distance minimale entre les groupes à chaque étape de fusion par rapport à la distance maximale entre les observations dans les données. La similarité s(ij) entre deux groupes i et j s'obtient avec s(ij) = 100 * [1 - d(ij)) / d(max)], d(max) étant la valeur maximale existant dans la matrice de distance D d'origine et d(ij) étant la distance entre i et j.

Interprétation

Utilisez le niveau de similarité pour les groupes qui sont liés à chaque étape afin de déterminer les groupements finaux de données. Recherchez un changement brusque dans le niveau de similarité entre les étapes. L'étape qui précède le changement brusque dans la similarité peut représenter un point de limitation approprié pour la subdivision finale. Pour la subdivision finale, les groupes doivent présenter un niveau de similarité raisonnablement élevé. Vous devez également utiliser vos connaissances pratiques des données pour déterminer les groupements finaux les plus pertinents dans votre application.

Par exemple, le tableau de fusion suivant indique que le niveau de similarité diminue par incréments d'environ 3 ou moins jusqu'à l'étape 15. La similarité diminue de plus de 20 (de 62,0036 à 41,0474) aux étapes 16 et 17, lorsque le nombre de groupes passe de 4 à 3. Ces résultats indiquent que 4 groupes peuvent suffire à constituer la subdivision finale. Si ce groupement semble intuitivement logique, ce peut être le bon choix.

Etapes de fusion Nombre d'obs. dans Nombre de Niveau de Niveau de Groupes Nouveau le nouveau Etape groupes similarité distance liés groupe groupe 1 19 96,6005 0,16275 13 16 13 2 2 18 95,4642 0,21715 17 20 17 2 3 17 95,2648 0,22669 6 9 6 2 4 16 92,9178 0,33905 17 18 17 3 5 15 90,5296 0,45339 11 15 11 2 6 14 90,3124 0,46378 12 19 12 2 7 13 88,2431 0,56285 5 8 5 2 8 12 88,2431 0,56285 2 14 2 2 9 11 85,9744 0,67146 6 10 6 3 10 10 83,0639 0,81080 7 13 7 3 11 9 83,0639 0,81080 1 3 1 2 12 8 81,4039 0,89027 2 17 2 5 13 7 79,8185 0,96617 6 11 6 5 14 6 78,7534 1,01716 4 12 4 3 15 5 66,2112 1,61760 2 5 2 7 16 4 62,0036 1,81904 1 6 1 7 17 3 41,0474 2,82229 1 4 1 10 18 2 40,1718 2,86421 2 7 2 10 19 1 0,0000 4,78739 1 2 1 20
Conseil

Pour évaluer visuellement les niveaux de similarité à chaque étape, utilisez le dendrogramme.

Niveau de distance

Distance séparant les groupes (avec la méthode de liaison choisie) ou les variables (avec la mesure de distance choisie) liés à chaque étape. Minitab calcule le niveau de distance en fonction de la méthode de liaison et de la mesure de distance sélectionnées dans la boîte de dialogue principale.

Interprétation

Utilisez le niveau de distance pour les groupes qui sont liés à chaque étape afin de déterminer les groupements finaux de données. Recherchez un changement brusque dans le niveau de distance entre les étapes. L'étape qui précède le changement brusque dans la distance peut représenter un point de référence approprié pour la subdivision finale. Pour la subdivision finale, les groupes doivent présenter un niveau de distance raisonnablement réduit. Vous devez également utiliser vos connaissances pratiques des données pour déterminer les groupements finaux les plus pertinents dans votre application.

Par exemple, le tableau de fusion suivant indique que le niveau de distance augmente d'environ 0,6 ou moins pour les 15 premières étapes. En revanche, lors des étapes 16 et 17, lorsque le nombre de groupes passe de 4 à 3, le niveau de distance augmente de plus de 1 (passant de 1,81904 à 2,82229). Ces résultats indiquent que 4 groupes peuvent suffire à constituer la subdivision finale. Si ce groupement semble intuitivement logique, ce peut être le bon choix.

Etapes de fusion Nombre d'obs. dans Nombre de Niveau de Niveau de Groupes Nouveau le nouveau Etape groupes similarité distance liés groupe groupe 1 19 96,6005 0,16275 13 16 13 2 2 18 95,4642 0,21715 17 20 17 2 3 17 95,2648 0,22669 6 9 6 2 4 16 92,9178 0,33905 17 18 17 3 5 15 90,5296 0,45339 11 15 11 2 6 14 90,3124 0,46378 12 19 12 2 7 13 88,2431 0,56285 5 8 5 2 8 12 88,2431 0,56285 2 14 2 2 9 11 85,9744 0,67146 6 10 6 3 10 10 83,0639 0,81080 7 13 7 3 11 9 83,0639 0,81080 1 3 1 2 12 8 81,4039 0,89027 2 17 2 5 13 7 79,8185 0,96617 6 11 6 5 14 6 78,7534 1,01716 4 12 4 3 15 5 66,2112 1,61760 2 5 2 7 16 4 62,0036 1,81904 1 6 1 7 17 3 41,0474 2,82229 1 4 1 10 18 2 40,1718 2,86421 2 7 2 10 19 1 0,0000 4,78739 1 2 1 20

Groupes liés

Deux groupes liés pour former un nouveau groupe à chaque étape du processus de fusion.

Nouveau groupe

Numéro d'identification du nouveau groupe formé à chaque étape du processus de fusion. Le numéro d'identification du nouveau groupe est toujours le plus petit des numéros des deux groupes liés. Par exemple, si le groupe 2 est lié au groupe 9, le nouveau groupe qui est formé s'appelle groupe 2.

Nombre d'observations dans un nouveau groupe

Nombre d'observations dans tout nouveau groupe à chaque étape du processus de fusion. Lors de la dernière étape, toutes les observations sont combinées en un seul groupe. C'est pourquoi le nombre d'observations dans le nouveau groupe pour la dernière étape est égal au nombre total d'observations dans les données.

Remarque

Pour la fonction Variables de groupes, le nombre d'observations correspond au nombre de variables dans le nouveau groupe.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique