TreeNet® 回帰による適合モデルおよび主要な予測変数を検出の最大残差による誤差統計量の百分率

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

誤差統計量の百分率を使用して、最悪の適合からモデルの適合値の誤差の量を調べます。分析で検証手法を使用する場合、トレーニングデータと検定データのモデルの統計量を比較することもできます。

表の各行には、指定された残差のパーセントに関する誤差の統計量が表示されます。最大の残差からの平均2乗誤差 (MSE) のパーセントは、通常、他の2つの統計量のパーセントよりも高くなります。MSEは計算で誤差の二乗を使用するため、最も極端な観測値は通常、統計量に最も大きな影響を与えます。MSEの誤差のパーセントと他の2つの基準との大きな違いは、最小2乗誤差または最小絶対偏差でノードを分岐する選択に対して、モデルがより敏感であることを示す可能性があります。

検証法を使用すると、トレーニングデータとテストデータに対して個別の統計量が計算されます。統計量を比較して、トレーニングデータと新しいデータに対する、モデルの相対的なパフォーマンスを調べることができます。通常、テストの統計量は、新しいデータに対してモデルがどのように働くかについての、優れた指標です。

可能性があるパターンは、残差のごく一部がデータの誤差の大部分を占めているというものです。たとえば、次の表では、データセットの合計サイズは約4400 です。MSEの観点からは、データの1%が誤差の約13%を占めていることを示しています。このような場合、モデルの誤差の大部分の原因となる31個のケースは、モデルを改善する最も当然な機会を表す可能性があります。これらのケースの適合値を改善する方法を見つけることは、モデル全体のパフォーマンスの比較的大きな向上につながります。

この状況は、このモデルの、最も大きな誤差が発生したケースがないノードに対する信頼度が高いことを示している場合もあります。誤差のほとんどは少数のケースから発生するため、他のケースの適合値は比較的正確です。

TreeNet® 回帰: 貸付金額 対 年収, 所得率, フロントエンド比率, バックエンド比率, 借主数, 年齢, 共同借主の年齢, ...

* 警告 * 次の水準が、トレーニングサンプル共同借主の人種3から欠損していました:5。 * 警告 * 次の水準が、トレーニングサンプル人種2から欠損していました:1。 * 警告 * 次の水準が、トレーニングサンプル共同借主の人種2から欠損していました:3。 * 警告 * 次の水準が、トレーニングサンプル州コードから欠損していました:44。 * 警告 * 次の水準が、トレーニングサンプル郡コードから欠損していました:203, 215, 251, 275, 281, 329, 441, 683, 700, 775。 * 警告 * 次の水準が、トレーニングサンプルコアベースの統計領域から欠損していました:10100, 10180, 10540, 10900, 10940, 11860, 12100, 12680, 13020, 13740, 13980, 15180, 16700, 17020, 17980, 18220, 18300, 18500, 19430, 19460, 19660, 21060, 21840, 22100, 22620, 24220, 24780, 25180, 25200, 26460, 27300, 28340, 28580, 28620, 30140, 30820, 31900, 31980, 33020, 33140, 33260, 33700, 34100, 34140, 35580, 35660, 35700, 35820, 37020, 37800, 38940, 39860, 40080, 40220, 41220, 41980, 43220, 43740, 44300, 44460, 45620, 47240, 47580。 * 警告 * 次の水準が、貸付目的のテストサンプルから欠損していました:4。 * 警告 * 次の水準が、人種2のテストサンプルから欠損していました:4。 * 警告 * 次の水準が、共同借主の人種2のテストサンプルから欠損していました:1, 2。 * 警告 * 次の水準が、共同借主の人種のテストサンプルから欠損していました:4。 * 警告 * 8つのカテゴリ予測変数に、トレーニングサンプルとテストサンプルのどちらにも存在しない水準があります。結果を解釈するときは、注意してください。[統 計]> [表]> [クロス集計およびカイ二乗]で、水準が欠落している箇所を特定できます。 最大残差による誤差統計の百分率 トレーニング テスト 最大残差の% 計数 %平均平方誤差 %平均絶対偏差 %平均絶対パーセント誤差 計数 %平均平方誤差 %平均絶対偏差 1.0 31 13.2824 4.9997 8.0885 14 21.6989 6.9082 2.0 62 21.3764 8.9374 12.9910 27 31.9396 11.6377 2.5 77 24.7125 10.6967 14.9989 33 35.7935 13.6106 3.0 93 27.9315 12.4817 17.0128 40 39.8022 15.7838 4.0 123 33.2979 15.6372 20.4671 53 45.8259 19.4124 5.0 154 38.1707 18.6937 23.7785 66 50.8291 22.7194 7.5 231 47.9001 25.4954 31.0104 98 59.7000 29.6264 10.0 307 55.3764 31.4216 37.0787 131 66.4339 35.7333 15.0 461 66.7462 41.8167 47.2740 196 75.4853 45.6703 20.0 614 74.8066 50.5429 55.5443 261 81.6292 53.8603
最大残差の% %平均絶対パーセント誤差 1.0 9.0517 2.0 14.0987 2.5 16.1761 3.0 18.4925 4.0 22.4744 5.0 25.9526 7.5 33.2548 10.0 39.2610 15.0 48.6658 20.0 56.3489
本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください