当您从 TreeNet®
回归 菜单中选择 发现关键预测变量 时,您可以指定如何排除这些项。
- 方法
- 首先选择排除最不重要或最重要的预测变量。
- 排除不重要的预测变量
- 首先排除最不重要的预测变量,以选择用于模型的预测变量的子集。例如,将包含 500 个预测变量的集合减少到 10 个最重要的预测变量。该算法会按顺序删除最不重要的预测变量,显示让您将模型与不同数量的预测变量进行比较的结果,并为具有模型选择标准最佳值的预测变量集合生成结果。
- 排除重要预测变量以评估其影响
- 首先排除最重要的预测变量,以评估对模型的影响。例如,当最重要的预测变量离开模型时,使用此选项可查看 R2 值的变化量。该算法会按顺序删除最重要的预测变量,显示能够让您评估每个重要预测变量对准确度标准的影响的结果,并使用所有预测变量为模型生成结果。
- 在每个步骤中排除 K
预测变量
- 通常,您一次排除 1 个预测变量。如果您拥有数量非常多的预测变量,并且您预计很少有预测变量非常重要,请考虑采用一个更大的值。例如,您可以在每个步骤删除更多的预测变量,并增加排除步骤的最大数量,以更快地删除更多预测变量。
- 最多排除步骤数
- 通常,排除步骤的最大数量是要检查的减少模型的数量,但如果模型已经没有预测变量,算法会提前停止。当您增加数量时,您通常会在每个步骤中排除相对于预测变量数的较少预测变量,并希望继续,以便您可以看到较小的模型。例如,您可以在每个步骤删除更多的预测变量,并增加排除步骤的最大数量,以更快地删除更多预测变量。降低此值以评估更少的备择模型。
- 指定最后要删除的预测变量
- 指定在其他预测变量之后要删除的预测变量的子集。例如,您有 10 个预测变量,并指定 3 个预测变量来最后删除。该算法在考虑您指定的 3 个预测变量中的任何一个之前删除了其他 7 个预测变量。通常,当您对一个或多个预测变量有特殊兴趣时,您指定要最后删除的预测变量。例如,您可以指定要最后删除的预测变量,以便算法仅用这些预测变量评估模型。
- 显示模型选择表格
- 选择是否显示训练数据的结果。
- 用于测试集
- 通常,您会显示测试集的结果。该算法使用这些结果来确定要排除哪些变量。检验结果指示模型是否可以充分预测新观测值的响应值,或是否可以正确汇总响应变量和预测变量之间的关系。
- 用于检验和训练集
- 对于新数据,训练结果通常比实际结果更理想。训练结果只供参考。