使用 TreeNet® 分类拟合模型发现关键预测变量 的数据注意事项

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

为确保结果有效,在收集数据、执行分析和解释结果时,请考虑以下准则。

响应变量应当是类别变量
类别变量包含有限、可数数目的类别或可区分组。类别数据可能具有逻辑顺序,也可能没有逻辑顺序。例如,类别变量包括性别、材料类型和付款方式。
  • 如果响应变量有两个类别(如通过和失败),则响应为二元响应。
  • 如果响应变量包含三个或更多类别,则响应为多项式响应。

响应变量的数据必须是文本值或数字值。不允许是日期/时间值。

如果您的响应变量为连续变量,请为 TreeNet® 回归 使用 拟合模型发现关键预测变量

预测变量可以是连续变量或类别变量
可以使用连续预测变量或类别预测变量的组合;但是,每个预测变量的列长度必须与响应列的长度相同。允许缺失值。
  • 所有连续预测变量都必须为数字。
  • 类别预测变量可以是文本或数字值。
当案例数超过 2000 时,建议使用检验集

默认情况下,案例数小于等于 2000 时,Minitab 将使用交叉验证。当案例数超过 2000 时,Minitab 将使用检验集。通常,交叉验证是更好的验证方法,但需要更多的时间来计算结果。如果交叉验证方法太耗时,则可采用“使用测试集验证”。

如需了解有关 拟合模型发现关键预测变量 中的验证方法设置的更多信息,请转到 为使用 TreeNet® 分类 的 拟合模型 和 发现关键预测变量 指定验证方法