におけるターミナルノードの適合値と誤差の統計量 CART® 回帰

使用する方法また計算式を選択します。

ノードの統計量は、個々のノードのデータから得られます。検証法を使用する場合、ノードの適合値は、テストデータセットのものでも、トレーニングデータセットのものでも、同じです。その他の統計量には、トレーニングまたはテストデータセットのノードの記録が使用されます。

これらの統計量は、最良または最悪のターミナルノードの表に表示されます。一般に、行は平均平方誤差 (MSE) または平均絶対偏差 (MAD) のいずれかの誤差のサイズによって並んでいます。両方の値が1未満の場合、1E-12内の値は同じです。どちらかの誤差値が1より大きい場合、1E-12*(大きい方の値)内の値は同じになります。重み付きカウント数で同じ値のものが並べ替えされます。重み付きカウント数も同じ場合、ノードIDで同じ値のものが並び替えされます。

適合値

適合値は、ノードの改善基準によって異なります。基準が最小平方の場合、適合値は平均です。

基準が最小絶対偏差の場合、適合値は中央値です。

標準偏差 (StDev)

平均平方誤差 (MSE)

平均絶対偏差 (MAD)

平均絶対パーセント誤差 (MAPE)

表記

用語説明
k番目 ノードの適合値
yi k番目 ノードにおける i 番目
k番目 ノード内のレコードに対する平均応答
nk k番目 ノード内のレコード数
nk, tトレーニング データ セットまたはテスト データ セット内の観測値の k番目 ノード内のレコード数
yi,tトレーニングデータセットまたはテストデータの k番目ノードでのi 番目観測応答値設定
トレーニングデータセットまたはテストデータのk番目ノードのレコードに対する平均応答設定