モデルの検証

Random Forests® 分類 では、すべての分析に対して、アウトオブバッグの検証を使用します。アウトオブバッグ検証に加えてテスト セットによる検証を選択すると、テスト セットを識別する、またはテストおよびトレーニング セットのデータの割合を識別する列がテーブルに表示されます。

ブートストラップサンプルの数

ブートストラップサンプルの数は、解析のツリー数を示します。アウトオブバッグ検証のみを使用する場合、サンプルサイズは分析の行数と同じです。テストセットによる検証を使用する場合、デフォルトのサンプルサイズはトレーニングデータのサイズと同じです。トレーニングデータのサイズよりも小さいサンプルサイズを使用する場合、表にそのサイズが表示されます。

ノード分割に選択された予測変数の数

この行は、ノード分割が各ノードのすべての予測変数を考慮するか、予測変数のランダム・サブセットを考慮するかを示します。ノード分割でランダムなサブセットが使用されている場合、この行は考慮すべき予測変数の数の選択を示します。

最初にすべての予測変数を使用する場合は、後続のモデルで予測変数のサブセットを使用してモデルのパフォーマンスを比較するかどうかを検討します。

最小内部ノードのサイズ

最小内部ノードのサイズとは、ノードに属することができ、さらに多くのノードに分割できるケースの最小数を示します。モデルのパフォーマンスが不十分な場合は、この値を大きくしてパフォーマンスへの影響を確認するかを検討します。

欠損値のペナルティ

デフォルトでは、分析には欠損値ペナルティがないため、この行は存在しません。欠損値ペナルティは、欠損値の比率に対する予測変数にペナルティを課します。ペナルティが高い変数は、ノードのスプリッターになる可能性が低くなります。

高水準カテゴリのペナルティ

デフォルトでは、分析には高水準カテゴリのペナルティが存在せず、この行は存在しません。高水準カテゴリのペナルティは、各ノードのノードのサイズに対するカテゴリ水準の数に基づいて変数にペナルティを課します。したがって、ノード内に多数の水準をもつ競合変数は、そのノードの分岐となる可能性が低くなります。

使用中の行

分析内の応答観測値の数。

未使用の行

欠損している応答の観測値の数。