R二乗対ターミナルノード数のプロットには、各木のR2値が表示されます。デフォルトでは、最初の回帰木は、最大のR2値の1標準誤差内のR2値をもつ最小の木です。分析で交差検証またはテストデータセットを使用する場合、R2値は検証サンプルからのものです。検証サンプルの値は、通常は横ばいになり、木が大きくなるにつれて最終的に減少し始めます。
代替木を選択をクリックして、モデルの要約の統計量の表を含むインタラクティブプロットを開きます。このプロットを使用して、類似したパフォーマンスをもつ代替の木を調べます。
21個のターミナルノードがある回帰木のR2値は約0.78です。木の生成基準は、R2の最大値の1標準偏差以内のR2値をもつ最小の木であるため、この木には「最適」というラベルがついています。このグラフは、約20個のノードがある木と約70個のノードがある木の間でR2値が比較的安定していることを示しているので、研究者は結果の木に類似した、いくつかの小さな木のパフォーマンスを調べたいと考えています。次のグラフを比較して、17個のノードがある木の結果を確認します。
17個のターミナルノードがある回帰木のR2値は0.7661 です。別の木の結果を生成するときに、最初の結果の木は「最適」というラベルを保持します。