평균 연결 방법에서 두 군집 사이의 거리는 한 군집에 있는 관측 개체와 다른 군집에 있는 관측 개체 사이의 평균 거리입니다. 평균 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
Nk | 군집 k의 관측치 수 |
Nl | 군집 l의 관측치 수 |
Nm | 군집 m의 관측치 수 |
중심 연결 방법에서 두 군집 사이의 거리는 군집 중심 또는 평균 사이의 거리입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
Nk | 군집 k의 관측치 수 |
Nl | 군집 l의 관측치 수 |
Nm | 군집 m의 관측치 수 |
완전 연결 방법(가장 먼 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집 내에 있는 관측치와 다른 군집 내에 있는 관측치의 최대 거리입니다. 완전 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
dmj = max (dkj, dlj)
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
McQuitty의 연결 방법에서 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
중위수 연결 방법을 사용할 경우 두 군집 사이의 거리는 한 군집에 있는 관측치와 다른 군집에 있는 관측치의 중위수 간 거리입니다. 중위수 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
dkl | 군집 k와 l 사이의 거리 |
단일 연결 방법(가장 가까운 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집 내에 있는 관측치와 다른 군집 내에 있는 관측치의 최소 거리입니다. 관측치가 서로 가까이 있으면 단일 연결에서는 양 끝에 있는 관측치의 거리가 비교적 먼 긴 체인 모양의 군집을 식별하려는 경향이 있습니다.
거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
dmj = min (dkj, dlj)
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
Ward의 연결 방법에서 두 군집 사이의 거리는 점에서 중심까지의 편차에 대한 제곱을 합한 것입니다. Ward 연결의 목표는 군집 내 제곱합을 최소화하는 것입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.
Ward의 연결 방법을 사용하는 경우 두 군집 사이의 거리는 원래 거리 행렬 D의 최대값인 dmax보다 커질 수 있습니다. 그러면 유사성이 음수가 됩니다.
용어 | 설명 |
---|---|
dmj | 군집 m과 j 사이의 거리 |
m | 군집 k와 l로 구성된 병합 군집, m = (k,i) |
dkj | 군집 k와 j 사이의 거리 |
dlj | 군집 l과 j 사이의 거리 |
dkl | 군집 k와 l 사이의 거리 |
Nj | 군집 j의 관측치 수 |
Nk | 군집 k의 관측치 수 |
Nl | 군집 l의 관측치 수 |
Nm | 군집 m의 관측치 수 |