Méthodes de liaison pour la fonction Observations en groupes

Moyenne

Avec la méthode de liaison moyenne, la distance entre deux groupes est égale à la distance moyenne entre une observation d'un groupe et une observation de l'autre. La distance moyenne est calculée avec la matrice de distance suivante :

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j
Nknombre d'observations dans le groupe k
Nlnombre d'observations dans le groupe l
Nmnombre d'observations dans le groupe m

Centré

Avec la méthode de liaison du point central, la distance séparant deux groupes est la distance entre les centres ou les moyennes des groupes. La distance est calculée avec la matrice de distance suivante :

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j
Nknombre d'observations dans le groupe k
Nlnombre d'observations dans le groupe l
Nmnombre d'observations dans le groupe m

Complet

Avec la méthode de liaison complète (dite du "voisin le plus éloigné"), la distance entre deux groupes est égale à la distance maximale entre une observation d'un groupe et une observation de l'autre. La distance complète est calculée avec la matrice de distance suivante :

dmj = max (dkj, dlj)

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j

McQuitty

Avec la méthode de liaison de McQuitty, la distance est calculée avec la matrice de distance suivante :

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j

Médiane

Avec la méthode de liaison médiane, la distance entre deux groupes est égale à la distance médiane entre une observation d'un groupe et une observation de l'autre. La distance médiane est calculée avec la matrice de distance suivante :

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j
dkldistance entre les groupes k et l

Unique

Avec la méthode de liaison simple (dite du voisin le plus proche), la distance entre deux groupes est égale à la distance minimale entre une observation d'un groupe et une observation de l'autre groupe. Lorsque les observations sont proches, elle tend à identifier des groupes semblables à de longues chaînes pouvant présenter une distance relativement grande entre les observations à chaque extrémité de la chaîne.

La distance est calculée avec la matrice de distance suivante :

dmj = min (dkj, dlj)

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j

Ward

Avec la méthode de liaison de Ward, la distance entre deux groupes est égale à la somme des écarts moyens quadratiques entre les points et les centres. Le but de la liaison de Ward est de minimiser la somme des carrés à l'intérieur du groupe. La distance est calculée avec la matrice de distance suivante :

Remarque

Avec cette méthode, la distance entre deux groupes peut être supérieure à dmax, la valeur maximale dans la matrice de distance initiale, D. Dans ce cas, la similarité est négative.

Notation

TermeDescription
dmjdistance entre les groupes m et j
mgroupe fusionné constitué des groupes k et l, avec m = (k,i)
dkjdistance entre les groupes k et j
dljdistance entre les groupes l et j
dkldistance entre les groupes k et l
Njnombre d'observations dans le groupe j
Nknombre d'observations dans le groupe k
Nlnombre d'observations dans le groupe l
Nmnombre d'observations dans le groupe m