クラスター観測値の主要な結果を解釈する

クラスター観測値分析を解釈するには、次の手順を実行します。主要な結果には、類似度および距離の値、樹形図、最終分割が含まれます。

ステップ1:類似度と距離水準を調べる

併合処理のステップごとに、作成されたクラスターを表示し、類似度と距離水準を調べます。類似度水準が高くなるほど、クラスターごとの観測値は似通ってきます。距離水準が低くなるほど、クラスターごとの観測値の距離が近くなります。

クラスターの類似水準が相対的に高く、距離水準が相対的に低くなるのが理想的です。ただし、目標と、クラスター数を合理的で実用的にすることとのバランスを取る必要があります。

併合ステップ 結合さ れたク 新しいクラス クラス 類似 ラス 新しいク ター内の観測 ステップ ター数 度の水準 距離水準 ター ラスター 値数 1 19 96.6005 0.16275 13 16 13 2 2 18 95.4642 0.21715 17 20 17 2 3 17 95.2648 0.22669 6 9 6 2 4 16 92.9178 0.33905 17 18 17 3 5 15 90.5296 0.45339 11 15 11 2 6 14 90.3124 0.46378 12 19 12 2 7 13 88.2431 0.56285 5 8 5 2 8 12 88.2431 0.56285 2 14 2 2 9 11 85.9744 0.67146 6 10 6 3 10 10 83.0639 0.81080 7 13 7 3 11 9 83.0639 0.81080 1 3 1 2 12 8 81.4039 0.89027 2 17 2 5 13 7 79.8185 0.96617 6 11 6 5 14 6 78.7534 1.01716 4 12 4 3 15 5 66.2112 1.61760 2 5 2 7 16 4 62.0036 1.81904 1 6 1 7 17 3 41.0474 2.82229 1 4 1 10 18 2 40.1718 2.86421 2 7 2 10 19 1 0.0000 4.78739 1 2 1 20
主要な結果:類似度水準と距離水準

これらの結果では、データには合計20個の観測値が含まれます。ステップ1では、2つのクラスター(ワークシート内の観測値13と16)は結合されて、新しいクラスターになります。このステップにより、データに19個のクラスターが作成され、類似度水準は96.6005、距離水準は0.16275となります。類似度水準は高く、距離水準は低くなるけれども、クラスター数が多すぎて役には立ちません。後続のステップごとに、新しいクラスターが作成されると、類似度水準は減少し、距離水準は増加します。最終ステップでは、すべての観測値が結合されて1つのクラスターになります。

樹形図の類似度水準を表示するには、Minitabの枝分かれ図上の水平線にポインタを置きます。

ステップ2:データの最終グループ化を判断する

ステップごとに結合されたクラスターの類似度の水準を使用して、データの最終グループ化を判断しやすくします。 ステップ間の類似度水準に急な変化があるかを確認します。類似度が急に変化する前のステップでは、最終分割に適した終止点が得られる可能性があります。最終分割では、クラスターの類似水準はかなり高くなる必要があります。データに関する実務知識も使用して、用途に最も適した最終グループ化を判断する必要があります。

たとえば、次の併合表は、類似度水準が、ステップ15までにおよそ3以下の単位で減少することを示します。類似度は、ステップ16と17の間で20以上(62.0036から41.0474へ)減少し、クラスター数は4から3に変化します。これらの結果は、最終分割では4つのクラスターが十分である可能性があることを示しています。こうしたグループ化が直観的な意味を持つとすれば、これが適していると考えられます。

併合ステップ 結合さ れたク 新しいクラス クラス 類似 ラス 新しいク ター内の観測 ステップ ター数 度の水準 距離水準 ター ラスター 値数 1 19 96.6005 0.16275 13 16 13 2 2 18 95.4642 0.21715 17 20 17 2 3 17 95.2648 0.22669 6 9 6 2 4 16 92.9178 0.33905 17 18 17 3 5 15 90.5296 0.45339 11 15 11 2 6 14 90.3124 0.46378 12 19 12 2 7 13 88.2431 0.56285 5 8 5 2 8 12 88.2431 0.56285 2 14 2 2 9 11 85.9744 0.67146 6 10 6 3 10 10 83.0639 0.81080 7 13 7 3 11 9 83.0639 0.81080 1 3 1 2 12 8 81.4039 0.89027 2 17 2 5 13 7 79.8185 0.96617 6 11 6 5 14 6 78.7534 1.01716 4 12 4 3 15 5 66.2112 1.61760 2 5 2 7 16 4 62.0036 1.81904 1 6 1 7 17 3 41.0474 2.82229 1 4 1 10 18 2 40.1718 2.86421 2 7 2 10 19 1 0.0000 4.78739 1 2 1 20
主要な結果:類似度水準とクラスター数

最終グループ化に関する決定は、樹形図のカットとも呼ばれます。樹形図のカットは、樹形図に水平線を引いて、最終グループを指定することと同じです。たとえば、この樹形図を4つのクラスターにカットするにあたって、垂直軸の下側、およそ41の類似度水準の真下あたりに水平線を描くことを想像してみてください。

ステップ3:最終分割を調べる

ステップ2の最終グループ化を決定後、分析を再実行して、最終分割のクラスター数(または類似度水準)を指定します。最終分割表を表示して、最終分割のクラスターごとの特徴を表示します。たとえば、クラスター重心までの平均距離により、各クラスター内の観測値のばらつきの測度が得られます。

最終分割のクラスターを調べて、グループ化が用途に対して論理的に見えるかを判断します。まだ不確実な場合、分析を繰り返して、異なる最終グループ化の樹形図を比較して、データにとって最も論理的な最終グループ化を決定します。

これらの統計量の詳細は最終分割(パーティション)を参照してください。

最終分割 (パーティション) クラス 観測 ター内の平 重心から 重心から 値数 方和内 の平均距離 の最大距離 クラスター1 7 3.25713 0.612540 1.12081 クラスター2 7 2.72247 0.581390 0.95186 クラスター3 3 0.55977 0.398964 0.54907 クラスター4 3 0.37116 0.326533 0.48848
クラスター重心 変数 クラスター1 クラスター2 クラスター3 クラスター4 全重心 性別 0.97468 -0.97468 0.97468 -0.97468 -0.0000000 身長 -1.00352 1.01283 -0.37277 0.35105 0.0000000 体重 -0.90672 0.93927 -0.86797 0.79203 -0.0000000 利き手 0.63808 0.63808 -1.48885 -1.48885 0.0000000
クラスター重心間の距離 クラスター1 クラスター2 クラスター3 クラスター4 クラスター1 0.00000 3.35759 2.21882 3.61171 クラスター2 3.35759 0.00000 3.67557 2.23236 クラスター3 2.21882 3.67557 0.00000 2.66074 クラスター4 3.61171 2.23236 2.66074 0.00000

樹形図

主要な結果:最終分割、樹形図

この樹形図は、4つのクラスターの最終分割を使用して作成され、およそ40の類似度水準で発生します。最初のクラスター(いちばん左)は7つの観測値(ワークシートの行1、3、6、9、10、11、15の観測値)から成ります。すぐ右側にある2つ目のクラスターは、3つの観測値(ワークシートの行4、12、19の観測値)から成ります。3つ目のクラスターは7つの観測値(行2、14、17、20、18、5、8の観測値)から成ります。いちばん右にある4つ目のクラスターは、3つの観測値(行7、13、16の観測値)から成ります。樹形図がこれより高い数値でカットされた場合、最終クラスター数は少なくなりますが、類似度水準は下がります。樹形図がこれより低い数値でカットされた場合、類似度水準は大きくなりますが、最終クラスター数は多くなります。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください