변수 군집에 대한 연결 방법

평균

평균 연결에서 두 군집 사이의 거리는 한 군집 내에 있는 변수와 다른 군집 내에 있는 변수의 평균 거리입니다. 평균 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리
Nk군집 k의 변수 수
Nl군집 l의 변수 수
Nm군집 m의 변수 수

중심

중심 연결에서 두 군집 사이의 거리는 군집 중심 또는 평균 사이의 거리입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리
Nk군집 k의 변수 수
Nl군집 l의 변수 수
Nm군집 m의 변수 수

완전

완전 연결 방법(가장 먼 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집 내에 있는 변수와 다른 군집 내에 있는 변수의 최대 거리입니다. 완전 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

dmj = max (dkj, dlj)

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리

McQuitty

McQuitty의 연결 방법에서 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리

중위수

중위수 연결에서 두 군집 사이의 거리는 한 군집에 있는 변수와 다른 군집에 있는 변수 중위수 간 거리입니다. 중위수 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj 군집 l과 j 사이의 거리
dkl군집 k와 l 사이의 거리

단일

단일 연결 방법(가장 가까운 이웃 방법이라고도 함)에서 두 군집 사이의 거리는 한 군집에 있는 변수와 다른 군집에 있는 변수 사이의 최소 거리입니다.

거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

dmj = min (dkj, dlj)

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리

Ward

Ward의 연결에서 두 군집 사이의 거리는 점에서 중심까지의 편차에 대한 제곱을 합한 것입니다. Ward 연결의 목표는 군집 내 제곱합을 최소화하는 것입니다. 거리는 다음과 같은 거리 행렬을 사용하여 계산됩니다.

참고

Ward의 연결에서 두 군집 사이의 거리는 원래 거리 행렬 D의 최대값인 d(max)보다 커질 수 있습니다. 그러면 유사성이 음수가 됩니다.

표기법

용어설명
dmj군집 m과 j 사이의 거리
m 군집 k와 l로 구성된 병합 군집, m = (k,i)
dkj군집 k와 j 사이의 거리
dlj군집 l과 j 사이의 거리
dkl군집 k와 l 사이의 거리
Nj군집 j의 변수 수
Nk군집 k의 변수 수
Nl군집 l의 변수 수
Nm군집 m의 변수 수