ベストモデルの検出(2値応答) のデータに関する考慮事項

このコマンドは、で使用できます予測分析モジュールモジュールをアクティブにする方法については、ここをクリックしてください

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

応答変数は2値である
2値応答には、合格や不合格などの2種類の結果があります。応答変数が連続変数の場合は、ベストモデルの検出(連続応答)を使用します。
この予測変数は連続またはカテゴリにすることができる

連続変数は測定および順序付けが可能で、2値間の間の数は無限です。たとえば、タイヤのサンプルの直径は連続変数です。

カテゴリ変数には、有限可算数のカテゴリまたは知覚グループが含まれます。カテゴリデータには、論理的順序がない場合があります。たとえば、カテゴリ予測変数には、性別、材料種、支払い方法が含まれます。

離散変数の場合、それを連続予測変数として扱うかカテゴリ予測変数として扱うかを決めることができます。離散変数は測定と順序付けが可能ですが、計数値をとります。たとえば、一世帯の人数は離散変数です。離散変数を連続として扱うかカテゴリとして扱うかは、水準数および分析の目的によって異なります。詳細については、カテゴリ変数、離散変数、連続変数とはを参照してください。

ケースの数が2000を超える場合は、テストセットが推奨されます。

Minitabでは、ケース数が2000≤の場合、クロス検証を使用してモデルを比較します。ケースの数が2000を超える場合、Minitabではテストセットが使用されます。データ セットが大きい場合、テスト セットを使用した検証によって、データの分析にかかる時間が短縮されます。ベストモデルの検出(2値応答) における検証法の設定の詳細については、ベストモデルの検出(2値応答) の検証法の指定を参照してください。

モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。すべてのモデル タイプには、モデルのパフォーマンスを記述するモデルサマリー統計が含まれます。クロス検証またはテスト セットの結果を使用して、モデルが応答を適切に予測するかどうかを判断します。