クラスターの最終グループ化を判断する

クラスターの最終的なグループ化(最終分割(パーティション)とも呼ばれます)とは、観測値または変数が持つ共通の特性に分けて対象をグループ化することです。最終グループ化に関する決定は、樹形図のカットとも呼ばれます。完全な樹形図(ツリー図)は、観測値または変数が1つのクラスターに併合される様子をグラフィカルに示します。樹形図のカットは、樹形図を横断する線を引いて、最終グループを指定することと同じです。以下の手順を行えば、樹形図をカットするかどうかを判断しやすくなります。

  1. デフォルトの設定(最終分割(パーティション)に1つのクラスター)を使用してクラスター分析を実行します。Minitabでは、可能性のあるすべてのクラスター数の結果を表示します。
  2. タブ出力と樹形図で、類似度水準と距離水準を調べます。 類似度水準は、樹形図の水平方向ライン上にマウスポインタを置くと表示できます。どのステップの類似度水準も、データの観測値間の最大距離を基準にした、そのステップの最小距離のパーセントになります。
  3. 最終分割を作成したい場所を選択します。 ステップ間で類似度または距離の値が変化するパターンは、最終分割(パーティション)を選択する際の参考になります。それがデータにとって論理的必然性のある変化であれば、値が突然変わるステップでは、樹形図をカットするのに適した位置を特定できるかもしれません。
  4. クラスター数または類似度の水準のいずれかを使用してクラスター手順を再度実行しすると、グループのセット数か樹形図をカットする類似度水準のいずれかが提供されます。
  5. 最終分割(パーティション)の結果クラスターを調べて、グループ化が論理的に見えるかを判断します。 別の最終グループ化の樹形図で調べることにより、データにとって最も論理的な樹形図を決定しやすくすることにもなります。

一部のデータセットでは、平均法、重心法、中央値法、およびウォード法によって階層構造の樹形図が作成されません。これは、併合距離が各ステップごとに常に増加するとは限らないことを示します。樹形図では、そのようなステップは上ではなく下に向かって進む結合を作成します。