指定 CART® 回归 的默认值

文件 > 选项 > 预测分析 > CART® 回归

指定回归树的默认方法。对默认设置所做的更改将保留到您再次更改它们,即使退出 Minitab 也是如此。

节点分裂方法
选择用于生成决策树的分裂方式。可以对两种分裂方式的结果进行比较,以确定适合应用的最佳选择。
  • 最小平方误差:最小平方误差方法是适用于诸多应用的默认方法。最小平方误差方法将平方误差之和降至最低。
  • 最小绝对偏差:最小绝对偏差方法将误差的绝对值之和降至最低。
选择最佳树的标准
最小平方误差为节点分裂方法的标准时,请在这些标准之间进行选择以在结果中生成树。可以比较不同树的结果,以确定适合应用的最佳选择。
最大 R 平方
选择此选项可显示具有最大 R 平方值的树的结果。
最大 R 平方的 K 个标准误内;K =
选择此选项可让 Minitab 选择 R2 值落在 R2 值最大的树的 K 个标准误内的最小树。默认情况下,K=1,因此结果中的树是 R2 值在最大 R2 值 1 个标准误内的最小分类树。
当选择最小绝对偏差作为节点分裂方法时,在这些标准之间进行选择以选择结果中的树。可以比较不同树的结果,以确定适合应用的最佳选择。
最小平均绝对偏差
选择此选项可显示具有最小平均绝对偏差的树的结果。
最小平均绝对偏差的 K 个标准误内;K =
选择此选项可让 Minitab 选择平均绝对偏差值落在平均绝对偏差值最小的树的 K 个标准误内的树。默认情况下,K=1,因此结果中的树是均值绝对偏差值在最小绝对偏差值 1 个标准误内的最小分类树。
用于拆分内部节点的最小案例数
输入一个值,以表示要分裂的内部节点的最小案例数。默认值为 10。对于更大的样本,您可能需要增大此最小值。例如,如果内部节点具有 10 个或更多案例,Minitab 将尝试执行分裂。如果内部节点的案例数不超过 9 个,Minitab 则不尝试执行分裂。
内部节点限值必须至少是终端节点限值的两倍,但此倍比越大越好。如果内部节点限值至少是终端节点限值的 3 倍,则分裂变量的数量会更加合理。
默认值为 10。
终端节点允许的最小案例数
输入一个值,以表示可分为一个终端节点的最小案例数。默认值为 3。对于更大的样本,您可能需要增大此最小值。例如,如果分裂将创建小于 3 个案例的节点,则 Minitab 不执行分裂。
默认值为 3。
缺失值惩罚
为具有缺失值的预测变量输入惩罚值。由于使用较少的数据更容易成为一个良好拆分变量,因此有缺失数据的预测变量比没有缺失数据的预测变量更有优势。使用此选项对缺失数据的预测变量进行惩罚。
0.0 ≤ K ≤ 2.0,例如:
  • K = 0: 指定不惩罚。
  • K = 2: 指定最高惩罚。
高阶属性惩罚
为具有许多值的类别预测变量输入惩罚值。由于具有许多水平的类别预测变量会因其分裂功效的增加而扭曲一个树,因此它们比具有较少水平的预测变量更有优势。使用此选项对具有多个水平的预测变量进行惩罚。
0.0 ≤ K ≤ 5.0,例如:
  • K = 0: 指定不惩罚。
  • K = 5: 指定最高惩罚。
显示图形和表
图中的残差
指定要在残差的箱线图上显示的残差类型。
  • 正规:默认情况下,箱线图显示正规残差。
  • 百分比:指定此项可在箱线图上显示百分比残差。
终端节点类型
选择是为拟合和误差统计量表以及对象分类标准表显示最佳节点、最差节点还是同时显示这两者。
  • 最佳:默认情况下,Minitab 显示最佳终端节点。最佳节点具有最低的 MSE 或 MAD 值。
  • 最差:选择此项可显示最差终端节点。最差节点具有最高的 MSE 或 MAD 值。
  • 最佳和最差:选择此项可显示最佳和最差终端节点。