数据注意事项 - CART® 回归

为确保结果有效,在收集数据、执行分析和解释结果时,请考虑以下准则。

响应变量(目标)应该为连续变量
可以对连续变量进行测量和排序,而且任意两个值之间有无限个值。例如,轮胎样本的直径即为连续变量。

响应变量的数据必须是数字值。

如果响应变量为类别变量,请使用 CART® 分类

预测变量可以是连续变量或类别变量
可以使用连续预测变量或类别预测变量的组合;但是,每个预测变量的列长度必须与响应列的长度相同。允许缺失值。
  • 所有连续预测变量都必须为数字。
  • 类别预测变量可以是文本或数字值。
当案例数超过 5000 时,建议使用检验集

默认情况下,案例数小于等于 5000 时,Minitab 将使用交叉验证。当案例数超过 5000 时,Minitab 将使用检验集。当数据集较大时,使用训练数据集和检验数据集进行验证非常有用。如需了解有关 CART® 回归中的验证方法设置的基本信息,请转到指定CART® 回归的验证方法