TreeNet^® 分類で適合モデルおよび主要な予測変数を検出の検証法を指定する

予測分析モジュール > TreeNet®分類 > 適合モデル > 検証

予測分析モジュール > TreeNet®分類 > 主要な予測変数を検出 > 検証

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証するには、次のステップを実行します。K分割交差検証法は、行数が2000以下の場合のデフォルトの方法です。

ドロップダウンリストからK分割交差検証を選択します。
次のいずれかを選択して、分割をランダムに割り当てるかID列を使用するかを指定します。
- 各分割の行をランダムに割り当てる: 各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。適合モデルでは、デフォルト値の5が大抵の場合で問題なく機能します。主要な予測変数を検出では、デフォルト値の3で比較的計算が速くなります。どちらの場合も分割数が多いほど、特に行数の少ないデータセットでは、より信頼性の高い予測モデルを選択する機会が増えますが、計算時間が大幅に長くなる可能性があります。
- ID列ごとに各分割の行を割り当てる: 各分割に含める行を選択するには、このオプションを選択します。ID列に、各分割の行を含む列を入力します。
（オプション）K分割交差検証のID列を保存するをチェックしてID列を保存します。

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。テストセットの検証法は、行数が2000を超える場合のデフォルトの方法です。多くの場合、データの70%がトレーニングに使用され、30%がテストに使用されます。

ドロップダウンリストからテストセットによる検証を選択します。
行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
- テストセットとして行のある割合をランダムに選択する: このオプションを選択すると、Minitabがテスト対象の行のある割合をランダムに選択します。割合を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。
- ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テストサンプルとして使用する水準を選択します。
（オプション）トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。

なしが選択されている場合、追加の検証は実行されません。