En liaison moyenne, la distance entre deux groupes est égale à la distance moyenne entre une variable d'un groupe et une variable de l'autre. La distance moyenne est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Nk | nombre de variables dans le groupe k |
Nl | nombre de variables dans le groupe l |
Nm | nombre de variables dans le groupe m |
En liaison du point central, la distance séparant deux groupes est la distance entre les centres ou les moyennes des groupes. La distance est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Nk | nombre de variables dans le groupe k |
Nl | nombre de variables dans le groupe l |
Nm | nombre de variables dans le groupe m |
Avec la méthode de liaison complète (dite du voisin le plus éloigné), la distance entre deux groupes est égale à la distance maximale entre une observation d'un groupe et une variable de l'autre. La distance complète est calculée avec la matrice de distance suivante :
dmj = max (dkj, dlj)
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
Avec la méthode de liaison de McQuitty, la distance est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
En liaison médiane, la distance entre deux groupes est égale à la distance médiane entre une variable d'un groupe et une variable de l'autre. La distance médiane est calculée avec la matrice de distance suivante :
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
dkl | distance entre les groupes k et l |
Avec la méthode de liaison simple, dite du voisin le plus proche, la distance entre deux groupes est égale à la distance minimale entre une variable d'un groupe et une variable de l'autre groupe.
La distance est calculée avec la matrice de distance suivante :
dmj = min (dkj, dlj)
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
En liaison de Ward, la distance entre deux groupes est égale à la somme des écarts quadratiques entre les points et les centres. Le but de la liaison de Ward est de minimiser la somme des carrés à l'intérieur du groupe. La distance est calculée avec la matrice de distance suivante :
Avec cette méthode, la distance entre deux groupes peut être supérieure à d(max), la valeur maximale dans la matrice de distance initiale, D. Dans ce cas, la similarité est négative.
Terme | Description |
---|---|
dmj | distance entre les groupes m et j |
m | groupe fusionné constitué des groupes k et l, avec m = (k,i) |
dkj | distance entre les groupes k et j |
dlj | distance entre les groupes l et j |
dkl | distance entre les groupes k et l |
Nj | nombre de variables dans le groupe j |
Nk | nombre de variables dans le groupe k |
Nl | nombre de variables dans le groupe l |
Nm | nombre de variables dans le groupe m |