ベストモデルの検出(連続応答)のデータに関する考慮事項

このコマンドは、で使用できます予測分析モジュールモジュールをアクティブにする方法については、ここをクリックしてください

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

応答変数は連続量である
連続変数は測定および順序付けが可能で、2値間の間の数は無限です。たとえば、タイヤのサンプルの直径は連続変数です。

応答変数のデータは数値である必要があります。

応答変数が連続変数の場合は、ベストモデルの検出(2値応答)を使用します。

予測変数は、連続またはカテゴリである場合があります。
連続予測変数またはカテゴリー予測変数の組み合わせを使用できます。ただし、各予測変数の列の長さは応答列と同じ長さである必要があります。欠損値は許容されます。
  • すべての連続予測変数は数値である必要があります。
  • カテゴリ予測変数は、テキストまたは数値である可能性があります。
ケースの数が2000を超える場合は、テストセットが推奨されます。

Minitabでは、ケース数が2000≤の場合、クロス検証を使用してモデルを比較します。ケースの数が2000を超える場合、Minitabではテストセットが使用されます。データ セットが大きい場合、テスト セットを使用した検証によって、データの分析にかかる時間が短縮されます。ベストモデルの検出(連続応答)における検証法の設定の詳細については、ベストモデルの検出(連続応答) の検証法の指定を参照してください。

モデルがデータに良好に適合している

モデルがデータに適合しない場合、結果は、誤った認識を与える可能性があります。すべてのモデル タイプには、モデルのパフォーマンスを表すモデルサマリー統計が含まれます。クロス検証またはテスト セットの結果を使用して、モデルが応答を適切に予測するかどうかを判断します。回帰モデルの出力では、残差プロットを使用して、パラメトリック仮定が保持されていることを確認します。