の誤分類コスト対ターミナルノード数のプロット CART® 分類

最も正確な木は、誤分類コストが最も低い木です。この木は、最適な木とも呼ばれます。

場合によっては、誤分類コストがやや高い、より単純な木も同様に機能します。通常、ターミナルノードがより少ない木で、各予測変数が応答値にどのように影響するかを明確に把握できます。より小さい木を使用すると、さらに調査を行うために、対象となるいくつかのグループを簡単に特定することもできます。より小さい木の予測の正確性の差がごくわずかである場合は、小さい方の木を使用して、応答変数と予測変数の関係を評価することができます。

代替木を選択をクリックすると、モデルの要約の統計量の表を含むプロットのインタラクティブビューが開きます。このプロットを使用して、パフォーマンスが類似している、より小さい木を調査します。

解釈

この例では、木の生成の基準が、誤分類コストが最小誤分類コストの1標準誤差内にある最小の木であるため、4つのターミナルノードがある木に、"最適" というラベルが付いています。4つのターミナルノードがある木の誤分類コストは、約0.415です。6つのターミナルノードがある木の誤分類コストは、約0.397と若干低くなっています。7つのターミナルノードがある木の誤分類コストは、約0.391です。代替木を選択を使用して別の木の結果を作成する場合、4つのターミナルノードがある最初の木には、「最適」のラベルが保持されます。