併合処理のステップごとに、作成されたクラスターを表示し、類似度と距離水準を調べます。類似度水準が高くなるほど、クラスターごとの観測値は似通ってきます。距離水準が低くなるほど、クラスターごとの観測値の距離が近くなります。
クラスターの類似水準が相対的に高く、距離水準が相対的に低くなるのが理想的です。ただし、目標と、クラスター数を合理的で実用的にすることとのバランスを取る必要があります。
ステップ | クラスター数 | 類似度の水準 | 距離水準 | 結合されたクラスター | 新しいクラスター | 新しいクラスタ ー内の観測値数 | |
---|---|---|---|---|---|---|---|
1 | 19 | 96.6005 | 0.16275 | 13 | 16 | 13 | 2 |
2 | 18 | 95.4642 | 0.21715 | 17 | 20 | 17 | 2 |
3 | 17 | 95.2648 | 0.22669 | 6 | 9 | 6 | 2 |
4 | 16 | 92.9178 | 0.33905 | 17 | 18 | 17 | 3 |
5 | 15 | 90.5296 | 0.45339 | 11 | 15 | 11 | 2 |
6 | 14 | 90.3124 | 0.46378 | 12 | 19 | 12 | 2 |
7 | 13 | 88.2431 | 0.56285 | 2 | 14 | 2 | 2 |
8 | 12 | 88.2431 | 0.56285 | 5 | 8 | 5 | 2 |
9 | 11 | 85.9744 | 0.67146 | 6 | 10 | 6 | 3 |
10 | 10 | 83.0639 | 0.81080 | 7 | 13 | 7 | 3 |
11 | 9 | 83.0639 | 0.81080 | 1 | 3 | 1 | 2 |
12 | 8 | 81.4039 | 0.89027 | 2 | 17 | 2 | 5 |
13 | 7 | 79.8185 | 0.96617 | 6 | 11 | 6 | 5 |
14 | 6 | 78.7534 | 1.01716 | 4 | 12 | 4 | 3 |
15 | 5 | 66.2112 | 1.61760 | 2 | 5 | 2 | 7 |
16 | 4 | 62.0036 | 1.81904 | 1 | 6 | 1 | 7 |
17 | 3 | 41.0474 | 2.82229 | 1 | 4 | 1 | 10 |
18 | 2 | 40.1718 | 2.86421 | 2 | 7 | 2 | 10 |
19 | 1 | 0.0000 | 4.78739 | 1 | 2 | 1 | 20 |
これらの結果では、データには合計20個の観測値が含まれます。ステップ1では、2つのクラスター(ワークシート内の観測値13と16)は結合されて、新しいクラスターになります。このステップにより、データに19個のクラスターが作成され、類似度水準は96.6005、距離水準は0.16275となります。類似度水準は高く、距離水準は低くなるけれども、クラスター数が多すぎて役には立ちません。後続のステップごとに、新しいクラスターが作成されると、類似度水準は減少し、距離水準は増加します。最終ステップでは、すべての観測値が結合されて1つのクラスターになります。
ステップごとに結合されたクラスターの類似度の水準を使用して、データの最終グループ化を判断しやすくします。ステップ間の類似度水準に急な変化があるかを確認します。類似度が急に変化する前のステップでは、最終分割に適した終止点が得られる可能性があります。最終分割では、クラスターの類似水準はかなり高くなる必要があります。データに関する実務知識も使用して、用途に最も適した最終グループ化を判断する必要があります。
たとえば、次の併合表は、類似度水準が、ステップ15までにおよそ3以下の単位で減少することを示します。類似度は、ステップ16と17の間で20以上(62.0036から41.0474へ)減少し、クラスター数は4から3に変化します。これらの結果は、最終分割では4つのクラスターが十分である可能性があることを示しています。こうしたグループ化が直観的な意味を持つとすれば、これが適していると考えられます。
ステップ | クラスター数 | 類似度の水準 | 距離水準 | 結合されたクラスター | 新しいクラスター | 新しいクラスタ ー内の観測値数 | |
---|---|---|---|---|---|---|---|
1 | 19 | 96.6005 | 0.16275 | 13 | 16 | 13 | 2 |
2 | 18 | 95.4642 | 0.21715 | 17 | 20 | 17 | 2 |
3 | 17 | 95.2648 | 0.22669 | 6 | 9 | 6 | 2 |
4 | 16 | 92.9178 | 0.33905 | 17 | 18 | 17 | 3 |
5 | 15 | 90.5296 | 0.45339 | 11 | 15 | 11 | 2 |
6 | 14 | 90.3124 | 0.46378 | 12 | 19 | 12 | 2 |
7 | 13 | 88.2431 | 0.56285 | 2 | 14 | 2 | 2 |
8 | 12 | 88.2431 | 0.56285 | 5 | 8 | 5 | 2 |
9 | 11 | 85.9744 | 0.67146 | 6 | 10 | 6 | 3 |
10 | 10 | 83.0639 | 0.81080 | 7 | 13 | 7 | 3 |
11 | 9 | 83.0639 | 0.81080 | 1 | 3 | 1 | 2 |
12 | 8 | 81.4039 | 0.89027 | 2 | 17 | 2 | 5 |
13 | 7 | 79.8185 | 0.96617 | 6 | 11 | 6 | 5 |
14 | 6 | 78.7534 | 1.01716 | 4 | 12 | 4 | 3 |
15 | 5 | 66.2112 | 1.61760 | 2 | 5 | 2 | 7 |
16 | 4 | 62.0036 | 1.81904 | 1 | 6 | 1 | 7 |
17 | 3 | 41.0474 | 2.82229 | 1 | 4 | 1 | 10 |
18 | 2 | 40.1718 | 2.86421 | 2 | 7 | 2 | 10 |
19 | 1 | 0.0000 | 4.78739 | 1 | 2 | 1 | 20 |
ステップ2の最終グループ化を決定後、分析を再実行して、最終分割のクラスター数(または類似度水準)を指定します。最終分割表を表示して、最終分割のクラスターごとの特徴を表示します。たとえば、クラスター重心までの平均距離により、各クラスター内の観測値のばらつきの測度が得られます。
これらの統計量の詳細は最終分割(パーティション)を参照してください。
観測値数 | クラスター内の平方和内 | 重心からの平均距離 | 重心からの最大距離 | |
---|---|---|---|---|
クラスター1 | 7 | 3.25713 | 0.612540 | 1.12081 |
クラスター2 | 7 | 2.72247 | 0.581390 | 0.95186 |
クラスター3 | 3 | 0.55977 | 0.398964 | 0.54907 |
クラスター4 | 3 | 0.37116 | 0.326533 | 0.48848 |
変数 | クラスター1 | クラスター2 | クラスター3 | クラスター4 | 全重心 |
---|---|---|---|---|---|
性別 | 0.97468 | -0.97468 | 0.97468 | -0.97468 | -0.0000000 |
身長 | -1.00352 | 1.01283 | -0.37277 | 0.35105 | 0.0000000 |
体重 | -0.90672 | 0.93927 | -0.86797 | 0.79203 | -0.0000000 |
利き手 | 0.63808 | 0.63808 | -1.48885 | -1.48885 | 0.0000000 |
クラスター1 | クラスター2 | クラスター3 | クラスター4 | |
---|---|---|---|---|
クラスター1 | 0.00000 | 3.35759 | 2.21882 | 3.61171 |
クラスター2 | 3.35759 | 0.00000 | 3.67557 | 2.23236 |
クラスター3 | 2.21882 | 3.67557 | 0.00000 | 2.66074 |
クラスター4 | 3.61171 | 2.23236 | 2.66074 | 0.00000 |