变量聚类的联结法

平均值

如果采用平均联结法,则两个聚类之间的距离等于一个聚类中的变量与另一个聚类中的变量之间的平均距离。该平均距离采用以下距离矩阵计算:

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离
Nk聚类 k 中的变量数
Nl聚类 l 中的变量数
Nm聚类 m 中的变量数

质心

如果采用质心法,则两个聚类之间的距离等于聚类质心或均值之间的距离。该距离采用以下距离矩阵计算:

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离
Nk聚类中 k 的变量数
Nl聚类中 l 的变量数
Nm聚类 m 中的变量数

最长距离法

如果采用最长距离法(亦称为最远邻接法),则两个聚类之间的距离等于一个聚类中的变量与另一个聚类中的变量之间的最大距离。最长距离采用以下距离矩阵计算:

dmj = max (dkj, dlj)

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离

简单平均

采用简单平均联结法,可使用以下距离矩阵计算距离:

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离

中位数

如果采用中间距离法,则两个聚类之间的距离等于一个聚类中的变量与另一个聚类中的变量之间的中间距离。该中间距离采用以下距离矩阵计算:

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离
dkl聚类 k 和 l 之间的距离

最短距离法

如果采用最短距离法(亦称为最近邻接法),则两个聚类之间的距离等于一个聚类中的变量与另一个聚类中的变量之间的最小距离。

该距离采用以下距离矩阵计算:

dmj = min (dkj, dlj)

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离

Ward

如果使用 Ward 联结法,则两个聚类之间的距离等于点到质心的平方差之和。Ward 联结的目的是使聚类内平方和最小。该距离采用以下距离矩阵计算:

注意

在 Ward 联结中,两个聚类之间的距离可以大于 d(max)(原始距离矩阵 D 中的最大值)。如果发生这种情况,则相似性将为负值。

表示法

说明
dmj聚类 m 和 j 之间的距离
m由聚类 k 和 l 组成的合并聚类,其中 m = (k,i)
dkj聚类 k 和 j 之间的距离
dlj聚类 l 和 j 之间的距离
dkl聚类 k 和 l 之间的距离
Nj聚类 j 中的变量数
Nk聚类 k 中的变量数
Nl聚类 l 中的变量数
Nm聚类 m 中的变量数