可用于树的预测变量总数。该值为您指定的连续预测变量和类别预测变量的总和。
树中重要预测变量的数量。重要预测变量是指用作主分裂变量或代理分裂变量的变量。
可以使用“相对变量重要性”图来显示相对变量重要性的顺序。例如,假设树中的 20 个预测变量中有 10 个比较重要,则“相对变量重要性”图会按重要性顺序显示变量。
终端节点是无法进一步分裂的最终节点。
您可以使用终端节点信息进行预测。
最小终端节点大小是案例数最少的终端节点。
默认情况下,Minitab 将终端节点允许的最小案例数设置为 3 个案例;但是,树的最小终端节点大小可以大于分析所允许的最小数量。您可以在选项子对话框中更改此阈值。
R2 是由模型解释的响应的变异百分比。异常值对 R2 的影响大于对 MAD 和 MAPE 的影响。
使用验证方法时,表中包含训练数据集的R2 统计量和验证方法的R2 统计量。当验证方法是k折交叉验证时,验证会使用每个折叠,前提是树构建排除了该折叠。验证结果中的R2 统计量通常是衡量模型在新数据下工作方式的更好指标。
使用 R2 可确定模型与数据的拟合程度。R2 值越高,模型与数据的拟合度越好。R2 始终介于 0% 和 100% 之间。
验证值 R2 远小于训练 R2 ,表明树可能无法很好地预测新病例的响应值,且树拟合当前数据集。
均方根误差 (RMSE) 衡量树的准确度。异常值对 RMSE 的影响大于对 MAD 和 MAPE 的影响。
当你使用验证方法时,表中包含训练数据集的RMSE统计量和验证结果的RMSE统计量。当验证方法是k折交叉验证时,验证会使用每个折叠,前提是树构建排除了该折叠。验证RMSE统计量通常是衡量模型在新数据中工作方式的更好指标。
用于比较不同树的拟合。值越小,拟合越好。一个明显高于训练RMSE的检验RMSE表明,该树可能无法很好地预测新病例的响应值,而该树对当前数据集的拟合度较低。
均方误 (MSE) 衡量树的准确度。异常值对 MSE 的影响大于对 MAD 和 MAPE 的影响。
当你使用验证方法时,表中包含训练数据集的MSE统计量和验证结果的MSE统计量。当验证方法是k重交叉验证时,验证会在模型构建排除该折叠时使用每个折点。验证MSE统计量通常是衡量模型在新数据中工作方式的更好指标。
用于比较不同树的拟合。值越小,拟合越好。一个验证MSE远大于训练MSE,表明树可能无法很好地预测新病例的响应值,而树对当前数据集的拟合度较高。
平均绝对偏差 (MAD) 以与数据相同的单位表示准确度,这有助于使误差量概念化。异常值对 MAD 的影响小于对 R2、RMSE 和 MSE 的影响。
当你使用验证方法时,表中包含训练数据集的MAD统计量和验证结果的MAD统计量。当验证方法是k重交叉验证时,验证会在模型构建排除该折叠时使用每个折点。验证MAD统计量通常是衡量模型在新数据中工作方式的更好指标。
用于比较不同树的拟合。值越小,拟合越好。一个验证MAD远大于训练MAD,表明树可能无法很好地预测新病例的响应值,而树对当前数据集的拟合度较高。
平均绝对百分比误差 (MAPE) 以误差的百分比来表示准确度。由于 MAPE 为百分比,因此与其他准确度度量统计量相比,它更易于理解。例如,如果 MAPE 平均为 0.05,则所有案例的拟合误差与实际值之间的平均比值为 5%。异常值对 MAPE 的影响小于对 R2、RMSE 和 MSE 的影响。
但是,有时您可能会看到非常大的 MAPE 值,即使树与数据的拟合情况良好也是如此。检查拟合与实际响应值图,查看是否有数据值接近 0。由于 MAPE 将绝对误差除以实际数据,因此接近 0 的值会显著加大 MAPE。
当你使用验证方法时,表中包含训练数据集的MAPE统计量和验证结果的MAPE统计量。当验证方法是k重交叉验证时,验证会在模型构建排除该折叠时使用每个折点。验证MAPE统计量通常是衡量模型在新数据中工作方式的更好指标。
用于比较不同树的拟合。值越小,拟合越好。一个验证MAPE远大于训练MAPE,表明树可能无法很好地预测新病例的响应值,而树对当前数据集的拟合度较高。