このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
研究チームは、アイオワ州エイムズの個々の居住用不動産の販売データを収集しています。研究者は、販売価格に影響を与える変数を特定したいと考えています。変数には、ロットサイズや居住用不動産のさまざまな特徴が含まれます。
重要な予測変数を特定するためにCART® 回帰で最初の探査を行った後、研究者はRandom Forests® 回帰を使用して同じデータセットからより集約的なモデルを作成します。研究者は、結果のモデル要約表とR2プロットを比較して、どちらが予測精度の高いモデルかを評価します。
これらのデータは、エイムズ住宅データの情報を含む公開データセットに基づいて調整されています。Truman州立大学DeCock教授からのオリジナルデータ。
モデル検証 | アウトオブバッグデータを使用した検証 |
---|---|
ブートストラップサンプルの数 | 300 |
サンプルサイズ | 2930のトレーニングデータサイズと同じ |
ノード分岐に対して選択された予測変数の数 | 予測変数の合計数の30% = 23 |
最小内部ノードのサイズ | 5 |
使用中の行 | 2930 |
平均 | 標準偏差 | 最小 | Q1 | 中央値 | Q3 | 最大 |
---|---|---|---|---|---|---|
180796 | 79886.7 | 12789 | 129500 | 160000 | 213500 | 755000 |
合計予測変数 | 77 |
---|---|
重要な予測変数 | 68 |
統計量 | アウトオブバッグ |
---|---|
R二乗 | 90.90% |
二乗平均平方根誤差(RMSE) | 24097.3281 |
平均平方誤差 (MSE) | 5.80681E+08 |
平均絶対偏差 (MAD) | 14746.8323 |
平均絶対パーセント誤差(MAPE) | 0.0895 |
モデル要約表は、R2値が対応するCART®分析のR2値よりもわずかに改善されていることを示しています。