使用 TreeNet® 回归拟合模型发现关键预测变量 的数据注意事项

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

为确保结果有效,在收集数据、执行分析和解释结果时,请考虑以下准则。

响应变量应当是连续变量
可以对连续变量进行测量和排序,而且任意两个值之间有无限个值。例如,轮胎样本的直径即为连续变量。

响应变量的数据必须是数字值。

如果响应变量为类别变量,请为 TreeNet® 分类 使用 拟合模型发现关键预测变量

预测变量可以是连续变量或类别变量
可以使用连续预测变量或类别预测变量的组合;但是,每个预测变量的列长度必须与响应列的长度相同。允许缺失值。
  • 所有连续预测变量都必须为数字。
  • 类别预测变量可以是文本或数字值。
当案例数超过 2000 时,建议使用检验集

默认情况下,案例数小于等于 2000 时,Minitab 将使用交叉验证。当案例数超过 2000 时,Minitab 将使用检验集。通常,交叉验证是更好的验证方法,但需要更多的时间来计算结果。如果交叉验证方法太耗时,则可采用“使用测试集验证”。

如需了解有关 拟合模型发现关键预测变量 中的验证方法设置的更多信息,请转到 为使用 TreeNet® 回归 的 拟合模型 和 发现关键预测变量 指定验证方法