En el enlace de promedios, la distancia entre dos conglomerados es la distancia promedio entre una variable de un conglomerado y una variable del otro conglomerado. La distancia promedio se calcula con la siguiente matriz de distancia:
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
Nk | número de variables en el conglomerado k |
Nl | número de variables en el conglomerado l |
Nm | número de variables en el conglomerado m |
En el enlace de centroides, la distancia entre los dos conglomerados es la distancia entre los centroides o las medias de los conglomerados. La distancia se calcula con la siguiente matriz de distancia:
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
Nk | número de variables en el conglomerado k |
Nl | número de variables en el conglomerado l |
Nm | número de variables en el conglomerado m |
Con el método de enlace completo (también conocido como el método del vecino más lejano), la distancia entre dos conglomerados es la distancia máxima entre una variable de un conglomerado y una variable del otro conglomerado. La distancia completa se calcula con la siguiente matriz de distancia:
dmj = max (dkj, dlj)
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
Con el método de enlace de McQuitty, la distancia se calcula con la siguiente matriz de distancia:
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
En el enlace de mediana, la distancia entre dos conglomerados es la mediana de la distancia entre una variable de un conglomerado y una variable del otro conglomerado. La mediana de distancia se calcula con la siguiente matriz de distancia:
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
dkl | distancia entre los conglomerados k y l |
Con el método de enlace individual (también conocido como el método del vecino más cercano), la distancia entre dos conglomerados es la distancia mínima entre una variable de un conglomerado y una variable del otro conglomerado.
La distancia se calcula con la siguiente matriz de distancia:
dmj = min (dkj, dlj)
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
En el enlace de Ward, la distancia entre dos conglomerados es la suma de las desviaciones al cuadrado desde los puntos hasta los centroides. El objetivo del enlace de Ward es minimizar la suma de los cuadrados dentro del conglomerado. La distancia se calcula con la siguiente matriz de distancia:
En el enlace de Ward, es posible que la distancia entre dos conglomerados sea mayor que d(max), el valor máximo en la matriz de distancia original, D. Si esto sucede, la similitud será negativa.
Término | Description |
---|---|
dmj | distancia entre los conglomerados m y j |
m | conglomerado combinado que consta de los conglomerados k y l, con m = (k,i) |
dkj | distancia entre los conglomerados k y j |
dlj | distancia entre los conglomerados l y j |
dkl | distancia entre los conglomerados k y l |
Nj | número de variables en el conglomerado j |
Nk | número de variables en el conglomerado k |
Nl | número de variables en el conglomerado l |
Nm | número de variables en el conglomerado m |