このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。
表の各行には、指定された残差のパーセントに関する誤差の統計量が表示されます。最大の残差からの平均2乗誤差 (MSE) のパーセントは、通常、他の2つの統計量のパーセントよりも高くなります。MSEは計算で誤差の二乗を使用するため、最も極端な観測値は通常、統計量に最も大きな影響を与えます。MSE と他の 2 つのメジャーの誤差率の大きな差は、R2 乗基準または平均絶対偏差基準を持つ基底関数の選択に対してモデルがより敏感であることを示している可能性があります。
検証手法を使用すると、結果にはトレーニング データとテスト データの個別の統計が含まれます。統計量を比較して、トレーニングデータと新しいデータに対する、モデルの相対的なパフォーマンスを調べることができます。通常、テストの統計量は、新しいデータに対してモデルがどのように働くかについての、優れた指標です。
可能性があるパターンは、残差のごく一部がデータの誤差の大部分を占めているというものです。たとえば、次の表では、データセットの合計サイズは約4400 です。MSE の観点からは、データの 1% がエラーの約 13% を占めることを示しています。このような場合、モデルの誤差の大部分の原因となる31個のケースは、モデルを改善する最も当然な機会を表す可能性があります。これらのケースの適合値を改善する方法を見つけることは、モデル全体のパフォーマンスの比較的大きな向上につながります。
この状況は、このモデルの、最も大きな誤差が発生したケースがないノードに対する信頼度が高いことを示している場合もあります。誤差のほとんどは少数のケースから発生するため、他のケースの適合値は比較的正確です。
トレーニング | テスト | |||||||
---|---|---|---|---|---|---|---|---|
最大残差の% | 計数 | %平均平方誤差 | %平均絶対偏差 | %平均絶対パーセント誤差 | 計数 | %平均平方誤差 | %平均絶対偏差 | %平均絶対パーセント誤差 |
1.0 | 31 | 13.2824 | 4.9997 | 8.0885 | 14 | 21.6989 | 6.9082 | 9.0517 |
2.0 | 62 | 21.3764 | 8.9374 | 12.9910 | 27 | 31.9396 | 11.6377 | 14.0987 |
2.5 | 77 | 24.7125 | 10.6967 | 14.9989 | 33 | 35.7935 | 13.6106 | 16.1761 |
3.0 | 93 | 27.9315 | 12.4817 | 17.0128 | 40 | 39.8022 | 15.7838 | 18.4925 |
4.0 | 123 | 33.2979 | 15.6372 | 20.4671 | 53 | 45.8259 | 19.4124 | 22.4744 |
5.0 | 154 | 38.1707 | 18.6937 | 23.7785 | 66 | 50.8291 | 22.7194 | 25.9526 |
7.5 | 231 | 47.9001 | 25.4954 | 31.0104 | 98 | 59.7000 | 29.6264 | 33.2548 |
10.0 | 307 | 55.3764 | 31.4216 | 37.0787 | 131 | 66.4339 | 35.7333 | 39.2610 |
15.0 | 461 | 66.7462 | 41.8167 | 47.2740 | 196 | 75.4853 | 45.6703 | 48.6658 |
20.0 | 614 | 74.8066 | 50.5429 | 55.5443 | 261 | 81.6292 | 53.8603 | 56.3489 |