適合モデル および 主要な予測変数を検出 の最大残差による誤差統計の割合 TreeNet® 回帰

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

誤差統計量の百分率を使用して、最悪の適合からモデルの適合値の誤差の量を調べます。解析が検証技術を用いる場合、トレーニングデータと検証結果のモデルの統計量を比較することも可能です。

表の各行には、指定された残差のパーセントに関する誤差の統計量が表示されます。最大残差から生じる平均二乗誤差(MSE)の割合は、他の2つの統計値の割合よりも通常高いです。MSEは計算で誤差の二乗を使用するため、最も極端な観測値は通常、統計量に最も大きな影響を与えます。MSEと他の2つの指標の誤差率の大きな差は、最小二乗誤差または最小絶対偏差を持つノードの分割選択により敏感であることを示しています。

検証技術を使うと、Minitabはトレーニングデータと検証結果の統計を別々に計算します。統計量を比較して、トレーニングデータと新しいデータに対する、モデルの相対的なパフォーマンスを調べることができます。検証統計量は、新しいデータに対するモデルの性能を示すより良い指標であることが多いです。

可能性があるパターンは、残差のごく一部がデータの誤差の大部分を占めているというものです。たとえば、次の表では、データセットの合計サイズは約4400 です。MSE の観点からは、データの 1% がエラーの約 13% を占めることを示しています。このような場合、モデルの誤差の大部分の原因となる31個のケースは、モデルを改善する最も当然な機会を表す可能性があります。これらのケースの適合値を改善する方法を見つけることは、モデル全体のパフォーマンスの比較的大きな向上につながります。

この状況は、このモデルの、最も大きな誤差が発生したケースがないノードに対する信頼度が高いことを示している場合もあります。誤差のほとんどは少数のケースから発生するため、他のケースの適合値は比較的正確です。

最大残差による誤差統計のパーセント


トレーニングテスト
最大残差の%計数%平均平方誤差%平均絶対偏差%平均絶対パーセント誤差計数%平均平方誤差%平均絶対偏差%平均絶対パーセント誤差
1.03113.28244.99978.08851421.69896.90829.0517
2.06221.37648.937412.99102731.939611.637714.0987
2.57724.712510.696714.99893335.793513.610616.1761
3.09327.931512.481717.01284039.802215.783818.4925
4.012333.297915.637220.46715345.825919.412422.4744
5.015438.170718.693723.77856650.829122.719425.9526
7.523147.900125.495431.01049859.700029.626433.2548
10.030755.376431.421637.078713166.433935.733339.2610
15.046166.746241.816747.274019675.485345.670348.6658
20.061474.806650.542955.544326181.629253.860356.3489