和发现关键预测变量的拟合模型模型总结表 TreeNet^® 回归

注意

该命令可通过 .单击此处了解更多关于如何激活模块的信息。

查找模型汇总表的定义和解释指南。

注意

Minitab 显示训练数据和验证结果的结果。验证结果表明模型是否能够充分预测新观测值的响应值，或者是否能够正确汇总响应变量与预测变量之间的关系。使用训练结果可评估模型是否过度拟合。

关于本主题

预测变量总数
重要预测变量
生成的树数
最优树数
R 平方

均方根误差 (RMSE)
均方误 (MSE)
平均绝对偏差 (MAD)
平均绝对百分比误差 (MAPE)

预测变量总数

可用于 TreeNet® 模型的预测变量总数。总数是您指定的连续预测变量数和类别预测变量数之和。

重要预测变量

TreeNet® 模型中重要预测变量的数量。重要预测变量的重要性分数大于 0.0。可以使用相对变量重要性图来显示相对变量重要性的顺序。例如，假设模型中的 20 个预测变量中有 10 个比较重要，则相对变量重要性图会按重要性顺序显示变量。

生成的树数

默认情况下，Minitab 会生成 300 个小 CART® 树来生成 TreeNet® 模型。尽管此值非常适合用于探索数据，但请考虑是否要生成更多的树来生成最终模型。要更改生成的树数，请转到选项子对话框。

最优树数

最优树数量对应于最高 R² 值或最低 MAD 值。

当最优树数接近模型生成的最大树数时，请考虑使用更多树进行分析。因此，如果生成 300 个树而最优数量返回为 298，则使用更多树重新构建模型。如果最优数量继续接近最大数量，则继续增加树数。

R 平方

R² 是由模型解释的响应的变异百分比。异常值对 R² 的影响大于对 MAD 和 MAPE 的影响。

使用验证方法时，表中包含训练数据集的R² 统计量和验证方法的R² 统计量。当验证方法是k折交叉验证时，验证会使用每个折叠，前提是树构建排除了该折叠。验证结果中的R² 统计量通常是衡量模型在新数据下工作方式的更好指标。

解释

使用 R² 可确定模型与数据的拟合程度。R² 值越高，模型与数据的拟合度越好。R² 始终介于 0% 和 100% 之间。

您可以图形方式说明不同 R² 值的含义。第一个图所示为简单回归模型，该模型可解释响应中 85.5% 的变异。第二个图所示的模型可解释响应中 22.6% 的变异。模型解释的变异越多，数据点越接近拟合值。从理论上讲，如果模型可以解释 100% 的变异，则拟合值始终等于观测值，所有数据点都将落在 y = x 线上。

验证R² 远小于训练R²，说明模型可能无法很好地预测新病例的响应值，而模型拟合当前数据集。

均方根误差 (RMSE)

均方根误差 (RMSE) 衡量模型的准确度。异常值对 RMSE 的影响大于对 MAD 和 MAPE 的影响。

当你使用验证方法时，表中包含训练数据集的RMSE统计量和验证结果的RMSE统计量。当验证方法是k折交叉验证时，验证会使用每个折叠，前提是树构建排除了该折叠。验证RMSE统计量通常是衡量模型在新数据中工作方式的更好指标。

解释

用于比较不同模型的拟合。值越小，拟合越好。验证RMSE远大于训练RMSE表明模型可能无法很好地预测新病例的反应值，而模型对当前数据集的拟合度较高。

均方误 (MSE)

均方误 (MSE) 衡量模型的准确度。异常值对 MSE 的影响大于对 MAD 和 MAPE 的影响。

当你使用验证方法时，表中包含训练数据集的MSE统计量和验证结果的MSE统计量。当验证方法是k重交叉验证时，验证会在模型构建排除该折叠时使用每个折点。验证MSE统计量通常是衡量模型在新数据中工作方式的更好指标。

解释

用于比较不同模型的拟合。值越小，拟合越好。验证MSE远大于训练MSE表明模型可能无法很好地预测新病例的反应值，而模型对当前数据集的拟合度较高。

平均绝对偏差 (MAD)

平均绝对偏差 (MAD) 以与数据相同的单位表示准确度，这有助于使误差量概念化。异常值对 MAD 的影响小于对 R²、RMSE 和 MSE 的影响。

当你使用验证方法时，表中包含训练数据集的MAD统计量和验证结果的MAD统计量。当验证方法是k重交叉验证时，验证会在模型构建排除该折叠时使用每个折点。验证MAD统计量通常是衡量模型在新数据中工作方式的更好指标。

解释

用于比较不同模型的拟合。值越小，拟合越好。验证MAD远大于训练MAD表明模型可能无法很好地预测新病例的反应值，而模型对当前数据集的拟合度较高。

平均绝对百分比误差 (MAPE)

平均绝对百分比误差 (MAPE) 以误差的百分比来表示准确度。由于 MAPE 为百分比，因此与其他准确度度量统计量相比，它更易于理解。例如，如果 MAPE 平均为 0.05，则所有案例的拟合误差与实际值之间的平均比值为 5%。异常值对 MAPE 的影响小于对 R²、RMSE 和 MSE 的影响。

但是，有时您可能会看到非常大的 MAPE 值，即使模型与数据的拟合情况良好也是如此。检查拟合与实际响应值图，查看是否有数据值接近 0。由于 MAPE 将绝对误差除以实际数据，因此接近 0 的值会显著加大 MAPE。

当你使用验证方法时，表中包含训练数据集的MAPE统计量和验证结果的MAPE统计量。当验证方法是k重交叉验证时，验证会在模型构建排除该折叠时使用每个折点。验证MAPE统计量通常是衡量模型在新数据中工作方式的更好指标。

解释

用于比较不同模型的拟合。值越小，拟合越好。验证MAPE远大于训练MAPE表明模型可能无法很好地预测新病例的反应值，而模型对当前数据集的拟合度较高。

和 发现关键预测变量 的 拟合模型 模型总结表 TreeNet® 回归

注意

注意