樹形図は、ステップごとの観測値とその類似度の水準のクラスター化によって形成されるグループを表示する枝分かれ図です。類似度水準が縦軸に沿って測定され(距離水準を表示することもできます)、さまざまな観測値が水平軸に沿って表示されます。

解釈

樹形図を使用して、ステップごとにクラスターが作成される方法を表示し、作成されたクラスターの類似度(または距離)の水準を評価します。

類似度(または距離)の水準を表示するには、Minitabの枝分かれ図上の水平線にポインタを置きます。ステップ間で類似度または距離の値が変化するパターンは、データの最終分割(パーティション)を選択する際の参考になります。値が急激に変わるステップが、最終グループ化を定義するのに適した位置です。

最終的なグループ化に関する決定は、樹形図のカットとも呼ばれます。樹形図のカットは、樹形図を横断する線を引いて、最終グループを指定することと同じです。別の最終分割(パーティション)がないかを樹形図で比較して、データにとって最も意味のある最終グループ化を判断することもできます。

この樹形図は、4つのクラスターの最終分割を使用して作成され、およそ40の類似度水準で発生します。最初のクラスター(かなり左寄り)は7つの観測値(ワークシートの行1、3、6、9、10、11、15にある観測値)から成ります。すぐ右側にある2つ目のクラスターは、3つの観測値(ワークシートの行4、12、19にある観測値)から成ります。3つ目のクラスターは、7つの観測値(行2、14、17、20、18、5、8にある観測値)から成ります。4つ目のクラスターは、3つの観測値(行7、13、16にある観測値)から成ります。樹形図がこれより高い数値でカットされた場合、最終クラスター数は少なくなりますが、類似度水準は下がります。樹形図がこれより低い数値でカットされた場合、類似度水準は大きくなりますが、最終クラスター数は多くなります。

一部のデータセットでは、平均法、重心法、中央値法、およびウォード法によって階層構造の樹形図が作成されません。これは、併合距離が各ステップごとに常に増加するとは限らないことを示します。樹形図では、このようなステップは上ではなく下に向かって進む結合を作成します。