TreeNet® 分類適合モデルおよび主要な予測変数を検出の検証法を指定する

予測分析モジュール > TreeNet®分類 > 適合モデル > 検証

予測分析モジュール > TreeNet®分類 > 主要な予測変数を検出 > 検証

このコマンドは、予測分析モジュールで使用できます。モジュールをアクティブにする方法については、ここをクリックしてください

モデルをテストする検証法を選択します。通常、サンプルが小さい場合は、K分割交差検証法が適しています。サンプルが大きい場合は、ある割合のトレーニングに使用するケースや、テストに使用するケースを選択できます。

K分割交差検証

K分割交差検証法を使用してテストサンプルを検証するには、次のステップを実行します。K分割交差検証法は、行数が2000以下の場合のデフォルトの方法です。

  1. ドロップダウンリストからK分割交差検証を選択します。
  2. 次のいずれかを選択して、分割をランダムに割り当てるかID列を使用するかを指定します。
    • 各分割の行をランダムに割り当てる: 各分割に対して行をランダムに選択するには、このオプションを選択します。分割数を指定できます。適合モデルでは、デフォルト値の5が大抵の場合で問題なく機能します。主要な予測変数を検出では、デフォルト値の3で比較的計算が速くなります。どちらの場合も分割数が多いほど、特に行数の少ないデータセットでは、より信頼性の高い予測モデルを選択する機会が増えますが、計算時間が大幅に長くなる可能性があります。
    • ID列ごとに各分割の行を割り当てる: 各分割に含める行を選択するには、このオプションを選択します。ID列に、各分割の行を含む列を入力します。
  3. (オプション)K分割交差検証のID列を保存するをチェックしてID列を保存します。

テストセットによる検証

トレーニングとテストに使用するデータの割合を指定するには、次のステップを実行します。テストセットの検証法は、行数が2000を超える場合のデフォルトの方法です。多くの場合、データの70%がトレーニングに使用され、30%がテストに使用されます。

  1. ドロップダウンリストからテストセットによる検証を選択します。
  2. 行のある割合をランダムに選択するか、ID列を使用するかを指定するには、次のいずれかを選択します。
    • テストセットとして行のある割合をランダムに選択する: このオプションを選択すると、Minitabがテスト対象の行のある割合をランダムに選択します。割合を指定できます。ほとんどの場合、デフォルト値の0.3が良好に機能します。より大きなデータセットの場合は、テストに使用するデータの割合を増やす必要がある場合があります。乱数生成器の初期値を設定することもできます。
    • ID列でのトレーニング/テスト分割を定義する: テストサンプルに含める行を選択するには、このオプションを選択します。ID列に、テストサンプルに使用する行を示す列を入力します。ID列には2つの値のみを含める必要があります。テストセットのレベルで、テストサンプルとして使用する水準を選択します。
  3. (オプション)トレーニング/テスト分割のID列を保存するをチェックしてID列を保存します。

なし

なしが選択されている場合、追加の検証は実行されません。