관측 개체 군집 분석에 대한 연결 방법

평균

평균 연결 방법에서 두 군집 사이의 거리는 한 군집에 있는 관측 개체와 다른 군집에 있는 관측 개체 사이의 평균 거리입니다. 평균 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리
Nk군집 k의 관측치 수
Nl군집 l의 관측치 수
Nm군집 m의 관측치 수

중심

중심 연결 방법에서 두 군집 사이의 거리는 군집 중심 또는 평균 사이의 거리입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리
Nk군집 k의 관측치 수
Nl군집 l의 관측치 수
Nm군집 m의 관측치 수

완전

완전 연결 방법(가장 먼 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집 내에 있는 관측치와 다른 군집 내에 있는 관측치의 최대 거리입니다. 완전 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

dmj = max (dkj, dlj)

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리

McQuitty

McQuitty의 연결 방법에서 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리

중위수

중위수 연결 방법을 사용할 경우 두 군집 사이의 거리는 한 군집에 있는 관측치와 다른 군집에 있는 관측치의 중위수 간 거리입니다. 중위수 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj 군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj 군집 l과 j 사이의 거리
dkl군집 k와 l 사이의 거리

단일

단일 연결 방법(가장 가까운 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집 내에 있는 관측치와 다른 군집 내에 있는 관측치의 최소 거리입니다. 관측치가 서로 가까이 있으면 단일 연결에서는 양 끝에 있는 관측치의 거리가 비교적 먼 긴 체인 모양의 군집을 식별하려는 경향이 있습니다.

거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

dmj = min (dkj, dlj)

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리

Ward

Ward의 연결 방법에서 두 군집 사이의 거리는 점에서 중심까지의 편차에 대한 제곱을 합한 것입니다. Ward 연결의 목표는 군집 내 제곱합을 최소화하는 것입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

참고

Ward의 연결 방법을 사용하는 경우 두 군집 사이의 거리는 원래 거리 행렬 D의 최대값인 dmax보다 커질 수 있습니다. 그러면 유사성이 음수가 됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리
dkl군집 k와 l 사이의 거리
Nj군집 j의 관측치 수
Nk군집 k의 관측치 수
Nl군집 l의 관측치 수
Nm군집 m의 관측치 수