のデータに関する考慮事項 CART® 回帰

有効な結果が確実に得られるようにするため、データの収集、分析の実行、および結果の解釈時には、次のガイドラインを考慮してください。

応答変数 (目的変数) は連続である必要があります。
連続変数は、測定および順序付けすることができ、任意の2つの値の間に無数の値があります。たとえば、タイヤのサンプルの直径は、連続変数です。

応答変数のデータは数値である必要があります。

応答変数がカテゴリ変数の場合は、 CART® 分類を使用してください。

予測変数は、連続またはカテゴリである場合があります。
連続予測変数またはカテゴリー予測変数の組み合わせを使用できます。ただし、各予測変数の列の長さは応答列と同じ長さである必要があります。欠損値は許容されます。
  • すべての連続予測変数は数値である必要があります。
  • カテゴリ予測変数は、テキストまたは数値である可能性があります。
ケースの数が5000を超える場合は、テストセットが推奨されます。

デフォルトでは、ケースの数が5000以下の場合、交差検証が使用されます。ケースの数が5000を超える場合、Minitabではテストセットが使用されます。トレーニングセットのデータとテストセットのデータを使用した検証は、データセットが大きい場合に有用です。 CART® 回帰における検証法の設定の詳細については、の検証法を指定する CART® 回帰を参照してください。