发现关键预测变量TreeNet® 回归示例

注意

此命令适用于 预测分析模块单击此处了解更多关于如何激活模块的信息

一组研究人员希望利用注塑成型过程的数据来研究可将塑料部件的一种强度最大化的机器的设置。变量包括对机器、不同的塑料配方和注塑机的控制。

作为对数据的初始探索的一部分,研究人员决定通过按顺序删除不重要的预测变量来识别关键预测变量,从而使用 发现关键预测变量 来比较模型。研究人员希望找出对响应影响最大的关键预测变量,并进一步深入了解响应与关键预测变量之间的关系。

  1. 打开样本数据集注射过程.MTW
  2. 选择 预测分析模块 > TreeNet® 回归 > 发现关键预测变量
  3. 响应中,输入强度
  4. 连续预测变量中,输入 注射压力测量温度
  5. 类别预测变量 中,输入 机器公式
  6. 单击 确定

解释结果

对于此分析,Minitab Statistical Software 比较了 20 个模型。模型评估表的模型列中的星号显示,具有交叉验证 R2 统计量的最大值的模型是模型 16。模型 16 包含 5 个重要预测变量。模型评估表之后的结果适用于模型 16。

虽然模型 16 具有交叉验证 R2 统计量的最大值,但其他模型具有类似的值。团队可以单击 选择备择模型,以从模型评估表中生成其他模型的结果。

在模型 16 的结果中,R 平方与树数图显示,最优树数等于分析中的树数 300。团队可以单击 调整超参数 以增加树数,并查看其他超参数的更改是否提高了模型的性能。

相对变量重要性图按照在对树序列上的预测变量进行拆分时预测变量对模型的改进作用的顺序,绘制预测变量的重要性图。最重要的预测变量为“模具温度”。如果顶部预测变量“模具温度”的重要度为 100%,则下一个重要变量“机器”的贡献为 58.7%。这意味着注塑机器与模具内部的温度一样重要,为 58.7%。

使用部分依赖图可以深入了解重要变量或变量对如何影响预测的响应。部分依赖图显示响应与变量之间的关系是线性、单调还是更复杂的关系。

单预测变量部分依赖图显示,模具温度、注塑压力和冷却温度都与强度存在正向关系。机器图显示了机器之间的差异,机器 1 的部件平均最弱,机器 4 的部件平均最强。研究小组注意到,模具温度和机器在数据中的交互作用最强,因此他们查看双预测变量部分依赖图,以进一步了解这些变量如何影响强度。团队可以在结果中进行选择 单预测变量图 ,以生成其他变量的绘图,例如 Injection Temperature (注射温度)。

模具温度和机器的双预测变量部分依赖图提供了对机器平均强度差异的一些见解。原因之一是,来自机器 1 的数据包含的最高模具温度下的观测结果不如其他机器那么多。当其他设置相同时,团队仍然可以决定寻找机器产生不同优势的其他原因。团队可以在结果中单击 双预测变量图 以生成其他变量对的图。

方法

损失函数平方误差
选择最优树数量的标准最大 R 平方
模型验证3 折叠交叉验证
学习速率0.01408
子样本部分0.5
每个树的最大终端节点数6
最小终端节点大小3
为进行节点拆分而选定的预测变量数预测变量总数 = 21
已使用的行数1408

响应信息

均值标准差最小值下四分位数中位数上四分位数最大值
485.247318.61141.2082301.099398.924562.4492569.04

通过排除不重要的预测变量选择模型

测试
模型最优树数R 平方 (%)预测变量数已排除的预测变量
130089.3221
230089.3419塑料流速, 更改位置
330089.3918干燥温度
430089.4617熔融温度区2
530089.5116塑料温度
630089.5015公式
730089.5914保持压力
830089.5713螺丝垫
930089.6912熔融温度区4
1030089.7011后压
1130089.8610熔融温度区1
1230089.909干燥时间
1330089.928测量温度
1430090.067熔融温度区5
1530090.166熔融温度区3
16*30090.235螺丝旋转速度
1730089.964注射温度
1829779.373冷却温度
1924466.642注射压力
2016446.191机器
该算法在每个步骤中删除了一个预测变量以及重要度为 0 的所有预测变量。
* 选定模型具有最大 R 平方。选定模型的输出如下。

模型汇总

总预测变量5
重要预测变量5
增长的树数300
最优树数300
统计量训练测试
R 平方92.23%90.23%
均方根误差 (RMSE)88.804999.5673
均方误差 (MSE)7886.31529913.6420
平均绝对偏差 (MAD)68.923174.4113
平均绝对百分比误差 (MAPE)0.20830.2175