Interprétation des résultats principaux pour la fonction Observations en groupes

Suivez les étapes ci-dessous pour interpréter une analyse des observations en groupes. Les résultats principaux comprennent les valeurs de similarité et de distance, le dendrogramme et la subdivision finale.

Sur ce thème

Etape 1 : Examiner les niveaux de similarité et de distance
Etape 2 : Déterminer les groupements finaux pour vos données
Etape 3 : Examiner la subdivision finale

Etape 1 : Examiner les niveaux de similarité et de distance

A chaque étape du processus de fusion, visualisez les groupes qui sont formés, et examinez leurs niveaux de similarité et de distance. Plus le niveau de similarité est élevé, plus les observations sont similaires dans chaque groupe. Plus le niveau de distance est faible, plus les observations sont proches dans chaque groupe.

Dans l'idéal, les groupes doivent avoir un niveau de similarité relativement élevé et un niveau de distance relativement faible. Cependant, vous devez trouver un équilibre entre cet objectif et le fait de disposer d'un nombre de groupes raisonnable et pratique.

Etapes de fusion

Etape	Nombre de groupes	Niveau de similarité	Niveau de distance	Groupes liés		Nouveau groupe	Nombre d'obs. dans le nouveau groupe
1	19	96,6005	0,16275	13	16	13	2
2	18	95,4642	0,21715	17	20	17	2
3	17	95,2648	0,22669	6	9	6	2
4	16	92,9178	0,33905	17	18	17	3
5	15	90,5296	0,45339	11	15	11	2
6	14	90,3124	0,46378	12	19	12	2
7	13	88,2431	0,56285	2	14	2	2
8	12	88,2431	0,56285	5	8	5	2
9	11	85,9744	0,67146	6	10	6	3
10	10	83,0639	0,81080	7	13	7	3
11	9	83,0639	0,81080	1	3	1	2
12	8	81,4039	0,89027	2	17	2	5
13	7	79,8185	0,96617	6	11	6	5
14	6	78,7534	1,01716	4	12	4	3
15	5	66,2112	1,61760	2	5	2	7
16	4	62,0036	1,81904	1	6	1	7
17	3	41,0474	2,82229	1	4	1	10
18	2	40,1718	2,86421	2	7	2	10
19	1	0,0000	4,78739	1	2	1	20

Résultats principaux : niveau de similarité, niveau de distance

Dans ces résultats, les données contiennent un total de 20 observations. A l'étape 1, deux groupes (observations 13 et 16 de la feuille de travail) sont liés pour former un nouveau groupe. Cette étape crée 19 groupes dans les données, avec un niveau de similarité de 96,6005 et un niveau de distance de 0,16275. Bien que le niveau de similarité soit élevé et que le niveau de distance soit faible, le nombre de groupes est trop élevé pour être utile. Lors des étapes suivantes, tandis que de nouveaux groupes sont formés, le niveau de similarité diminue et le niveau de distance augmente. Lors de la dernière étape, toutes les observations sont liées en un seul groupe.

Pour visualiser les niveaux de similarité dans le dendrogramme, positionnez le pointeur de la souris sur une ligne horizontale de l'arborescence, dans Minitab.

Etape 2 : Déterminer les groupements finaux pour vos données

Utilisez le niveau de similarité pour les groupes qui sont liés à chaque étape afin de déterminer les groupements finaux de données.Recherchez un changement brusque dans le niveau de similarité entre les étapes. L'étape qui précède le changement brusque dans la similarité peut représenter un point de limitation approprié pour la subdivision finale. Pour la subdivision finale, les groupes doivent présenter un niveau de similarité raisonnablement élevé. Vous devez également utiliser vos connaissances pratiques des données pour déterminer les groupements finaux les plus pertinents dans votre application.

Par exemple, le tableau de fusion suivant indique que le niveau de similarité diminue par incréments d'environ 3 ou moins jusqu'à l'étape 15. La similarité diminue de plus de 20 (de 62,0036 à 41,0474) aux étapes 16 et 17, lorsque le nombre de groupes passe de 4 à 3. Ces résultats indiquent que 4 groupes peuvent suffire à constituer la subdivision finale. Si ce groupement semble intuitivement logique, ce peut être le bon choix.

Etapes de fusion

Etape	Nombre de groupes	Niveau de similarité	Niveau de distance	Groupes liés		Nouveau groupe	Nombre d'obs. dans le nouveau groupe
1	19	96,6005	0,16275	13	16	13	2
2	18	95,4642	0,21715	17	20	17	2
3	17	95,2648	0,22669	6	9	6	2
4	16	92,9178	0,33905	17	18	17	3
5	15	90,5296	0,45339	11	15	11	2
6	14	90,3124	0,46378	12	19	12	2
7	13	88,2431	0,56285	2	14	2	2
8	12	88,2431	0,56285	5	8	5	2
9	11	85,9744	0,67146	6	10	6	3
10	10	83,0639	0,81080	7	13	7	3
11	9	83,0639	0,81080	1	3	1	2
12	8	81,4039	0,89027	2	17	2	5
13	7	79,8185	0,96617	6	11	6	5
14	6	78,7534	1,01716	4	12	4	3
15	5	66,2112	1,61760	2	5	2	7
16	4	62,0036	1,81904	1	6	1	7
17	3	41,0474	2,82229	1	4	1	10
18	2	40,1718	2,86421	2	7	2	10
19	1	0,0000	4,78739	1	2	1	20

Résultats principaux : niveau de similarité, nombre de groupes

On désigne également le choix du regroupement final par l'expression "couper le dendrogramme". Couper le dendrogramme revient à tracer une ligne horizontale à travers le dendrogramme pour spécifier le groupement final. Par exemple, pour couper ce dendrogramme en quatre groupes, imaginez que vous tracez une ligne horizontale à peu près à la moitié de l'axe vertical, juste en dessous du niveau de similarité d'environ 41.

Etape 3 : Examiner la subdivision finale

Après avoir déterminé les groupements finaux lors de l'étape 2, répétez l'analyse et spécifiez le nombre de groupes (ou le niveau de similarité) de la subdivision finale. Minitab affiche le tableau de la subdivision finale, indiquant les caractéristiques de chaque groupe dans la subdivision finale. Par exemple, la distance moyenne du point central fournit une mesure de la variabilité des observations dans chaque groupe.

Examinez les groupes obtenus dans la subdivision finale afin de déterminer si le groupement semble logique pour votre application. Si vous avez encore un doute, vous pouvez répéter l'analyse et comparer les dendrogrammes de différents groupements finaux pour déterminer celui qui est le plus logique par rapport à vos données.

Remarque

Pour plus d'informations sur ces statistiques, reportez-vous à la rubrique Subdivision finale.

Subdivision finale

	Nombre d'observations	Dans la somme des carrées de groupe	Distance moyenne du centré	Distance maximale du centré
Groupe1	7	3,25713	0,612540	1,12081
Groupe2	7	2,72247	0,581390	0,95186
Groupe3	3	0,55977	0,398964	0,54907
Groupe4	3	0,37116	0,326533	0,48848

Points centraux du groupe

Variable	Groupe1	Groupe2	Groupe3	Groupe4	Grand centré
Sexe	0,97468	-0,97468	0,97468	-0,97468	-0,0000000
Hauteur	-1,00352	1,01283	-0,37277	0,35105	0,0000000
Poids	-0,90672	0,93927	-0,86797	0,79203	-0,0000000
Droitier/Gaucher	0,63808	0,63808	-1,48885	-1,48885	0,0000000

Distance entre les points centraux des groupes

	Groupe1	Groupe2	Groupe3	Groupe4
Groupe1	0,00000	3,35759	2,21882	3,61171
Groupe2	3,35759	0,00000	3,67557	2,23236
Groupe3	2,21882	3,67557	0,00000	2,66074
Groupe4	3,61171	2,23236	2,66074	0,00000

Résultats principaux : subdivision finale, dendrogramme

Ce dendrogramme a été créé avec une subdivision finale de 4 groupes, ce qui se produit à un niveau de similarité d'environ 40. Le premier groupe (à l'extrémité gauche) est composé de sept observations (observations des lignes 1, 3, 6, 9, 10, 11 et 15 de la feuille de travail). Le deuxième groupe, à sa droite, est composé de 3 observations (observations des lignes 4, 12 et 19 de la feuille de travail). Le troisième groupe est composé de 7 observations (observations des lignes 2, 14, 17, 20, 18, 5 et 8). Le quatrième groupe, à l'extrémité droite, est composé de 3 observations (observations des lignes 7, 13 et 16). Si vous coupiez le dendrogramme plus haut, les groupes finaux seraient moins nombreux, mais le niveau de similarité serait réduit. Si vous coupiez le dendrogramme plus bas, le niveau de similarité serait supérieur, mais les groupes finaux seraient plus nombreux.