拟合回归模型示例

研究化学家想要了解多个预测变量与棉布抗皱性的关联性。化学家检查 32 件在不同的凝固时间、凝固温度、甲醛浓度和催化剂比率下生产出的棉纤维素。对每件棉布都记录了耐压等级(用来度量抗皱性)。

The chemist performs a multiple regression analysis to fit a model with the predictors and eliminate the predictors that do not have a statistically significant relationship with the response.

  1. 打开样本数据抗皱性.MTW.
  2. 选择统计 > 回归 > 回归 > 拟合回归模型
  3. 响应中,输入评级
  4. 连续预测变量中,输入浓度比率温度时间
  5. 单击图形
  6. 效应图下,选择Pareto
  7. 残差图下,选择四合一
  8. 残差与变量中,输入浓度比率温度时间
  9. 单击每个对话框中的确定

解释结果

作为预测变量的温度、催化剂比率和甲醛浓度的 p 值小于显著水平 0.05。这些结果表示这些预测变量对抗皱性具有统计意义上非常显著的效应。时间的 p 值大于 0.05,这表示没有足够的证据可以断定时间与响应相关。化学家可能需要重新拟合不具有此预测变量的模型。

Pareto 图显示在显著性水平为 0.05 时,温度、催化剂比率和甲醛浓度的效应在统计意义上显著。最大的效应是催化剂比率,因为它延伸得最远。最小的效应是时间效应,因为它延伸得最近。

此残差图指示该模型可能有问题。
  • 残差与拟合值图中的点并未随机分布在零附近。但似乎存在表示不同数据组的点群集。化学家应该研究这些组以确定其原因。
  • 残差与比率图显示了弯曲,这表明催化剂比率与皱纹之间具有曲线关系。化学家应该考虑向该模型添加比率的二次项。

回归方程

评级=-0.756 + 0.1545 浓度 + 0.2171 比率 + 0.01081 温度 + 0.0946 时间

系数

系数系数标准误T 值P 值方差膨胀因子
常量-0.7560.736-1.030.314 
浓度0.15450.06332.440.0221.03
比率0.21710.03166.860.0001.02
温度0.010810.004622.340.0271.04
时间0.09460.05461.730.0941.00

模型汇总

SR-sqR-sq(调整)R-sq(预测)
0.81184072.92%68.90%62.81%

方差分析

来源自由度Adj SSAdj MSF 值P 值
回归447.909611.977418.170.000
  浓度13.92323.92325.950.022
  比率131.021631.021647.070.000
  温度13.60313.60315.470.027
  时间11.98391.98393.010.094
误差2717.79530.6591   
  失拟2517.78360.7113121.940.008
  纯误差20.01170.0058   
合计3165.7049     

异常观测值的拟合和诊断

观测值评级拟合值残差标准化残差
94.8003.1781.6222.06R
R  残差大