평균 연결에서 두 군집 사이의 거리는 한 군집 내에 있는 변수와 다른 군집 내에 있는 변수의 평균 거리입니다. 평균 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
Nk | 군집 k의 변수 수 |
Nl | 군집 l의 변수 수 |
Nm | 군집 m의 변수 수 |
중심 연결에서 두 군집 사이의 거리는 군집 중심 또는 평균 사이의 거리입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
Nk | 군집 k의 변수 수 |
Nl | 군집 l의 변수 수 |
Nm | 군집 m의 변수 수 |
완전 연결 방법(가장 먼 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집 내에 있는 변수와 다른 군집 내에 있는 변수의 최대 거리입니다. 완전 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
dmj = max (dkj, dlj)
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
McQuitty의 연결 방법에서 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
중위수 연결에서 두 군집 사이의 거리는 한 군집에 있는 변수와 다른 군집에 있는 변수 중위수 간 거리입니다. 중위수 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
dkl | 군집 k와 l 사이의 거리 |
단일 연결 방법(가장 가까운 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집에 있는 변수와 다른 군집에 있는 변수 사이의 최소 거리입니다.
거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
dmj = min (dkj, dlj)
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
Ward의 연결에서 두 군집 사이의 거리는 점에서 중심까지의 편차에 대한 제곱을 합한 것입니다. Ward 연결의 목표는 군집 내 제곱합을 최소화하는 것입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
Ward의 연결에서 두 군집 사이의 거리는 원래 거리 행렬 D의 최대값인 d(max)보다 커질 수 있습니다. 그러면 유사성이 음수가 됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
dkl | 군집 k와 l 사이의 거리 |
Nj | 군집 j의 변수 수 |
Nk | 군집 k의 변수 수 |
Nl | 군집 l의 변수 수 |
Nm | 군집 m의 변수 수 |