適合モデルおよび主要な予測変数を検出の最大残差による誤差統計の割合 TreeNet^® 回帰

注

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください。

誤差統計量の百分率を使用して、最悪の適合からモデルの適合値の誤差の量を調べます。解析が検証技術を用いる場合、トレーニングデータと検証結果のモデルの統計量を比較することも可能です。

表の各行には、指定された残差のパーセントに関する誤差の統計量が表示されます。最大残差から生じる平均二乗誤差(MSE)の割合は、他の2つの統計値の割合よりも通常高いです。MSEは計算で誤差の二乗を使用するため、最も極端な観測値は通常、統計量に最も大きな影響を与えます。MSEと他の2つの指標の誤差率の大きな差は、最小二乗誤差または最小絶対偏差を持つノードの分割選択により敏感であることを示しています。

検証技術を使うと、Minitabはトレーニングデータと検証結果の統計を別々に計算します。統計量を比較して、トレーニングデータと新しいデータに対する、モデルの相対的なパフォーマンスを調べることができます。検証統計量は、新しいデータに対するモデルの性能を示すより良い指標であることが多いです。

可能性があるパターンは、残差のごく一部がデータの誤差の大部分を占めているというものです。たとえば、次の表では、データセットの合計サイズは約4400 です。MSE の観点からは、データの 1% がエラーの約 13% を占めることを示しています。このような場合、モデルの誤差の大部分の原因となる31個のケースは、モデルを改善する最も当然な機会を表す可能性があります。これらのケースの適合値を改善する方法を見つけることは、モデル全体のパフォーマンスの比較的大きな向上につながります。

この状況は、このモデルの、最も大きな誤差が発生したケースがないノードに対する信頼度が高いことを示している場合もあります。誤差のほとんどは少数のケースから発生するため、他のケースの適合値は比較的正確です。

最大残差による誤差統計のパーセント

	トレーニング				テスト
最大残差の%	計数	%平均平方誤差	%平均絶対偏差	%平均絶対パーセント誤差	計数	%平均平方誤差	%平均絶対偏差	%平均絶対パーセント誤差
1.0	31	13.2824	4.9997	8.0885	14	21.6989	6.9082	9.0517
2.0	62	21.3764	8.9374	12.9910	27	31.9396	11.6377	14.0987
2.5	77	24.7125	10.6967	14.9989	33	35.7935	13.6106	16.1761
3.0	93	27.9315	12.4817	17.0128	40	39.8022	15.7838	18.4925
4.0	123	33.2979	15.6372	20.4671	53	45.8259	19.4124	22.4744
5.0	154	38.1707	18.6937	23.7785	66	50.8291	22.7194	25.9526
7.5	231	47.9001	25.4954	31.0104	98	59.7000	29.6264	33.2548
10.0	307	55.3764	31.4216	37.0787	131	66.4339	35.7333	39.2610
15.0	461	66.7462	41.8167	47.2740	196	75.4853	45.6703	48.6658
20.0	614	74.8066	50.5429	55.5443	261	81.6292	53.8603	56.3489

適合モデル および 主要な予測変数を検出 の最大残差による誤差統計の割合 TreeNet® 回帰

注

最大残差による誤差統計のパーセント

適合モデルおよび主要な予測変数を検出の最大残差による誤差統計の割合 TreeNet^® 回帰