クラスターの最終グループ化を判断する

クラスターの最終グループ化(最終分割(パーティション)とも呼ばれます)とは、観測値または変数が持つ共通の特性に分けて対象をグループ化することです。最終グループ化に関する決定は、樹形図のカットとも呼ばれます。完全な樹形図(ツリー図)は、観測値または変数が1つのクラスターに併合される様子を絵的に示します。樹形図のカットは、樹形図を横断する線を引いて、最終グループを指定することと同じです。次のステップにより、樹形図をどこでカットするかを判断しやすくなります。

  1. デフォルト設定(最終分割のクラスターは1つ)を使用して、クラスター分析を実行します。Minitabでは、起こりうるすべてのクラスター数の結果を表示します。
  2. セッションウィンドウの結果と樹形図で、類似度水準と距離水準を調べます。 類似度水準は、樹形図の水平方向ライン上にマウスポインタを置くと表示できます。どのステップの類似度水準も、データの観測値間の最大距離を基準にした、そのステップの最小距離のパーセントになります。
  3. 最終分割を作成したい場所を選択します。 ステップ間で類似度または距離の値が変化するパターンは、最終分割(パーティション)を選択する際の参考になります。それがデータにとって論理的必然性のある変化であれば、値が突然変わるステップでは、樹形図をカットするのに適した位置を特定できるかもしれません。
  4. クラスター数または類似度の水準のいずれかを使用してクラスター手順を再度実行しすると、グループのセット数か樹形図をカットする類似度水準のいずれかが提供されます。
  5. 最終分割(パーティション)の結果クラスターを調べて、グループ化が論理的に見えるかを判断します。 別の最終グループ化の樹形図で調べることにより、データにとって最も論理的な樹形図を決定しやすくすることにもなります。

一部のデータセットでは、平均法、重心法、中央値法、およびウォード法によって階層構造の樹形図が作成されません。これは、併合距離が各ステップごとに常に増加するとは限らないことを示します。樹形図では、そのようなステップは上ではなく下に向かって進む結合を作成します。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください