选择 CART® 回归 的分析选项

预测分析模块 > CART® 回归 > 选项

选择分析选项。

节点分裂方法
选择用于生成决策树的分裂方式。可以对两种分裂方式的结果进行比较,以确定适合应用的最佳选择。
  • 最小平方误差:最小平方误差方法是适用于诸多应用的默认方法。最小平方误差方法将平方误差之和降至最低。
  • 最小绝对偏差:最小绝对偏差方法将误差的绝对值之和降至最低。
选择最佳树的标准
最小平方误差为节点分裂方法的标准时,请在这些标准之间进行选择以在结果中生成树。可以比较不同树的结果,以确定适合应用的最佳选择。
最大 R 平方
选择此选项可显示具有最大 R 平方值的树的结果。
最大 R 平方的 K 个标准误内;K =
选择此选项可让 Minitab 选择 R2 值落在 R2 值最大的树的 K 个标准误内的最小树。默认情况下,K=1,因此结果中的树是 R2 值在最大 R2 值 1 个标准误内的最小分类树。
当选择最小绝对偏差作为节点分裂方法时,在这些标准之间进行选择以选择结果中的树。可以比较不同树的结果,以确定适合应用的最佳选择。
最小平均绝对偏差
选择此选项可显示具有最小平均绝对偏差的树的结果。
最小平均绝对偏差的 K 个标准误内;K =
选择此选项可让 Minitab 选择平均绝对偏差值落在平均绝对偏差值最小的树的 K 个标准误内的树。默认情况下,K=1,因此结果中的树是平均值绝对偏差值在最小绝对偏差值 1 个标准误内的最小分类树。
具有缺失值的预测变量的代理数
输入在预测变量缺失值时 Minitab 搜索的代理数量。当许多预测变量具有类似的缺失值模式时,应增加代理的数量。
此数字表示将要搜索的最大代理数量;但是,实际上可能找不到该数量的代理。
默认值为 10。
用于拆分内部节点的最小案例数
输入一个值,以表示要分裂的内部节点的最小案例数。默认值为 10。对于更大的样本,您可能需要增大此最小值。例如,如果内部节点具有 10 个或更多案例,Minitab 将尝试执行分裂。如果内部节点的案例数不超过 9 个,Minitab 则不尝试执行分裂。
内部节点限值必须至少是终端节点限值的两倍,但此倍比越大越好。如果内部节点限值至少是终端节点限值的 3 倍,则分裂变量的数量会更加合理。
终端节点允许的最小案例数
输入一个值,以表示可分为一个终端节点的最小案例数。默认值为 3。对于更大的样本,您可能需要增大此最小值。例如,如果分裂将创建小于 3 个案例的节点,则 Minitab 不执行分裂。
最大树深度
输入一个值,以表示树的最大深度。根节点对应于深度 1。如果要确保获得最优树,则需考虑更深的树,即使这可能会减慢处理速度。
权重
输入包含案例权重的列。该列所具有的行数必须与响应列所具有的行数相同。值必须大于等于 0。Minitab 会在分析中忽略包含缺失值或零的行。