指定回归树的默认设置

文件 > 验证 > 预测分析 > CART®回归

指定回归树的默认方法。对默认设置所做的更改将保留到您再次更改它们,即使退出 Minitab 也是如此。

节点分裂方式
选择拆分方法生成决策树。您可以比较两种拆分方法的结果,以确定应用程序的最佳选择。
  • :最小平方错误方法是在许多应用程序中工作良好的默认方法。最小平方错误方法将平方误差的总和降至最低。
  • :最小绝对偏差方法最小化误差的绝对值之和。
选择最优树的标准
当节点拆分方法的标准时,在这些标准之间选择以在结果中生成树。您可以比较不同树的结果,以确定应用程序的最佳选择。
最大 R 平方
选择此选项可显示具有最大 R 平方值的树的结果。
最大 R 平方的 K 个标准误内;K =
选择此选项可让 Minitab 选择具有 R2 值的最小树,该树属于具有最大 R2 值的树的 K 标准误差内。默认情况下,K=1,因此结果中的树是最小分类树,在最大 R2 值的 1 个标准误差范围内具有 R2 值。
当选择为节点拆分方法时,在以下条件之间进行选择以在结果中选择树。您可以比较不同树的结果,以确定应用程序的最佳选择。
最小平均绝对偏差
选择此选项可显示平均偏差最小的树的结果。
最小平均绝对偏差的 K 个标准误内;K =
Select this option to have Minitab choose a tree with a mean absolute deviation value that falls within K standard errors of the tree with the least mean absolute deviation value. 默认情况下,K=1,因此结果中的树是最小的经典树,平均绝对偏差值在最小绝对偏差值的 1 个标准误差内。
用于拆分内部节点的最小案例数
输入一个值来表示要拆分的内部节点的最小案例数。默认值是 10。如果样本大小较大,您可能需要增加此最小值。例如,如果内部节点具有 10 个或更多情况,Minitab 将尝试执行拆分。如果内部节点有 9 个或更少的情况,Minitab 将不会尝试执行拆分。
内部节点限制必须至少是终端节点限制的两倍,但较大的比率更好。终端节点限制的内部节点限制至少为 3 倍,允许合理数量的拆分器。
默认值是 .10。
终端节点允许的最小案例数
输入一个值以表示可分隔到终端节点的最小案例数。默认值为 3。如果样本大小较大,您可能需要增加此最小值。例如,如果拆分将创建少于 3 个案例的节点,Minitab 将不会执行拆分。
默认值是 .3。
缺少值值
输入缺少值的预测变量的罚值。由于成为数据较少的好拆分器更容易,因此缺少数据的预测变量比预测变量具有优势,而不会丢失数据。使用此选项可惩罚缺少数据的预测变量。
.0 = K = 2.0,例如:
  • K = 0:不指定任何惩罚。
  • K = 2:指定最高惩罚。
高级别类别处罚
为具有许多值的分类预测变量输入惩罚值。由于具有多个级别的分类预测变量会由于拆分能力的增加而扭曲树,因此它们比水平较低的预测变量具有优势。使用此选项可惩罚具有多个级别的预测变量。
.0 = K = 5.0,例如:
  • K = 0:不指定任何惩罚。
  • K = 5:指定最高惩罚。
显示图形和表格
图中的残差
指定要在残差图的框图上显示的残差类型。
  • :默认情况下,框图显示常规残差。
  • : 指定以显示框图上的残差百分比。
终端节点类型
选择是显示最佳节点、最差节点,还是显示"适合"和"错误统计信息表"和"主题分类标准"表的最佳节点。
  • :默认情况下,Minitab 显示最佳的终端节点。最佳节点具有最低的 MSE 或 MAD 值。
  • :选择以显示最差的终端节点。最差节点具有最高的 MSE 或 MAD 值。
  • :选择以显示最佳和最差终端节点。
使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策