Avec la méthode de liaison moyenne, la distance entre deux groupes est égale à la distance moyenne entre une observation d'un groupe et une observation de l'autre. La distance moyenne est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Nk | nombre d'observations dans le groupe k |
Nl | nombre d'observations dans le groupe l |
Nm | nombre d'observations dans le groupe m |
Avec la méthode de liaison du point central, la distance séparant deux groupes est la distance entre les centres ou les moyennes des groupes. La distance est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Nk | nombre d'observations dans le groupe k |
Nl | nombre d'observations dans le groupe l |
Nm | nombre d'observations dans le groupe m |
Avec la méthode de liaison complète (dite du "voisin le plus éloigné"), la distance entre deux groupes est égale à la distance maximale entre une observation d'un groupe et une observation de l'autre. La distance complète est calculée avec la matrice de distance suivante :
dmj = max (dkj, dlj)
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Avec la méthode de liaison de McQuitty, la distance est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Avec la méthode de liaison médiane, la distance entre deux groupes est égale à la distance médiane entre une observation d'un groupe et une observation de l'autre. La distance médiane est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
dkl | distance entre les groupes k et l |
Avec la méthode de liaison simple (dite du voisin le plus proche), la distance entre deux groupes est égale à la distance minimale entre une observation d'un groupe et une observation de l'autre groupe. Lorsque les observations sont proches, elle tend à identifier des groupes semblables à de longues chaînes pouvant présenter une distance relativement grande entre les observations à chaque extrémité de la chaîne.
La distance est calculée avec la matrice de distance suivante :
dmj = min (dkj, dlj)
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Avec la méthode de liaison de Ward, la distance entre deux groupes est égale à la somme des écarts moyens quadratiques entre les points et les centres. Le but de la liaison de Ward est de minimiser la somme des carrés à l'intérieur du groupe. La distance est calculée avec la matrice de distance suivante :
Avec cette méthode, la distance entre deux groupes peut être supérieure à dmax, la valeur maximale dans la matrice de distance initiale, D. Dans ce cas, la similarité est négative.
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
dkl | distance entre les groupes k et l |
Nj | nombre d'observations dans le groupe j |
Nk | nombre d'observations dans le groupe k |
Nl | nombre d'observations dans le groupe l |
Nm | nombre d'observations dans le groupe m |