使用 Pareto 效应图可比较项的相对量值与统计显著性。该图在模型保留误差的自由度时显示。
Minitab 按照项的绝对值的递减顺序为这些项绘图。图中的参考线表明哪些项是显著项。默认情况下,Minitab 使用显著性水平 0.05 绘制参考线。
项 | 系数 | 系数标准误 | T 值 | P 值 | 方差膨胀因子 |
---|---|---|---|---|---|
常量 | -0.756 | 0.736 | -1.03 | 0.314 | |
浓度 | 0.1545 | 0.0633 | 2.44 | 0.022 | 1.03 |
比率 | 0.2171 | 0.0316 | 6.86 | 0.000 | 1.02 |
温度 | 0.01081 | 0.00462 | 2.34 | 0.027 | 1.04 |
时间 | 0.0946 | 0.0546 | 1.73 | 0.094 | 1.00 |
甲醛浓度、催化剂比率和温度等预测变量的 P 值小于显著水平 .05。这些结果表示这些预测变量与抗皱性之间存在统计上非常显著的关系。例如,甲醛浓度系数估计浓度每增加一个单位,抗皱性平均值增加 .1545 个单位,而模型中的其他项保持恒定。
时间的 P 值大于 .05,这表示没有足够的证据可以断定时间与响应变量相关。化学家可能需要重新拟合不具有此预测变量的模型。
要确定模型与数据的拟合优度,请检查模型汇总表中的拟合优度统计量。
使用 S 可评估模型描述响应值的程度。使用 S 替代 R2 统计量,以比较不具有常量的模型拟合。
S 以响应变量的单位进行度量,它表示数据值与拟合值的距离。S 值越低,模型描述响应的程度越高。但是,自身低 S 值并不表明模型符合模型假设。您应检查残差图来验证假设。
R2 值越高,模型拟合数据的优度越高。R2 始终介于 0% 和 100% 之间。
如果向模型添加其他预测变量,则 R2 会始终增加。例如,最佳的 5 预测变量模型的 R2 始终比最佳的 4 预测变量模型的高。因此,比较相同大小的模型时 R2 最有效。
在想要比较具有不同数量的预测变量的情况下,使用调整的 R2。如果向模型添加预测变量,即使模型没有实际改善,R2 也会始终增加。调整的 R2 值包含模型中的预测变量数,以便帮助您选择正确的模型。
使用预测的 R2 可确定模型对新观测值的响应进行预测的程度。具有较大预测 R2 值的模型的预测能力也较出色。
实质上小于 R2 的预测的 R2 可能表明模型过度拟合。在向总体中添加不太重要的影响项的情况下,可能会发生过度拟合模型。模型针对样本数据而定制,因此可能对于总体预测不太有效。
在比较模型方面,预测的 R2 还可能比调整的 R2 更有效,因为它是用模型计算中未包含的观测值计算得出的。
样本数量较小则不能提供对于响应变量和预测变量之间关系强度的精确估计。如果需要 R2 更为精确,则应当使用较大的样本(通常为 40 或更多)。
拟合优度统计量只是模型拟合数据优度的一种度量。即使模型具有合意的值,您也应当检查残差图,以验证模型是否符合模型假设。
S | R-sq | R-sq(调整) | R-sq(预测) |
---|---|---|---|
0.811840 | 72.92% | 68.90% | 62.81% |
在这些结果中,模型可以解释响应变量中约 73% 的变异。对于这些数据,R2 值表示模型与数据充分拟合。如果要拟合具有不同预测变量的其他模型,请使用调整的 R2 值和预测的 R2 值比较模型与数据的拟合。
使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。
有关如何处理残差图模式的更多信息,请转到和 的 线性回归残差图 拟合回归模型,然后单击页面顶部列表中残差图的名称。
使用残差与拟合值图可验证残差随机分布和具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。
模式 | 模式的含义 |
---|---|
残差相对拟合值呈扇形或不均匀分散 | 异方差 |
曲线 | 缺少高阶项 |
远离 0 的点 | 异常值 |
在 X 方向远离其他点的点 | 有影响的点 |
使用残差正态概率图可验证残差呈正态分布的假设。残差的正态概率图应该大致为一条直线。
模式 | 模式的含义 |
---|---|
非直线 | 非正态性 |
远离直线的点 | 异常值 |
斜率不断变化 | 未确定的变量 |