解释非线性回归的主要结果

要解释非线性回归模型,请完成以下步骤。主要输出包括拟合线图、回归标准误和残差图。

步骤 1:确定回归线是否与数据拟合

如果非线性模型包含一个预测变量,Minitab 会显示拟合线图来表明响应和预测变量数据之间的关系。该图包含回归线,可表示回归方程。您还可以选择在图上显示 95% 置信区间和预测区间。

评估模型与数据的拟合优度以及模型是否符合您的目标。检查拟合线图来确定是否符合下列标准:
  • 在具有所有预测变量值的整个范围中,样本包含充足的观测值个数。
  • 模型与数据中的任何弯曲正确拟合。要确定最佳模型,请在数据包含仿行的情况下,检查图、回归标准误 (S) 以及失拟检验。
  • 查找任何异常值,这些值可能对结果产生较强的影响。尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。有关检测异常值的更多信息,请转到异常观测值
在此拟合线图中,回归线紧密遵循点中的弯曲。可能不存在任何拟合线的系统偏差。这些点足够覆盖整个预测变量值范围。

步骤 2:检查预测变量与响应变量之间的关系

使用回归方程可描述模型中响应和项之间的关系。回归方程是回归线的代数表示。将每个预测变量的值输入方程可计算平均响应值。与线性回归不同,非线性回归方程可以采取多种不同形式。

对于非线性方程,在确定每个预测变量对响应的影响时可能不如线性方程那样直观。与线性模型中的参数估计值不同,非线性模型中的参数估计值的解释不一致。每个参数的正确解释取决于预期函数以及参数在预期函数中的位置。如果非线性模型只包含一个预测变量,可评估拟合线图来查看预测变量和响应之间的关系。

如果需要确定参数估计值是否统计意义显著,请使用参数的置信区间。如果此范围不包含原假设值,则参数的统计意义显著。Minitab 无法计算非线性回归中的参数 p 值。对于线性回归,每个参数的原假设值为零(没有效应),而且 p 值以此值为基础。但是,在非线性回归中,每个参数的正确原假设值取决于预期函数以及参数在预期函数中的位置。

对于某些数据集、预期函数和置信水平,其中一个或两个置信边界可能不存在。Minitab 使用星号指示缺失的结果。如果置信区间有缺失边界,置信水平较低时可能产生双侧区间。

解决方案收敛并不一定能保证模型拟合最优或误差平方和 (SSE) 最小。局部 SSE 最小或预期函数不正确都会导致在错误参数值的条件下收敛。因此,至关重要的是,对参数值、拟合线图和残差图进行检查,确定模型是否拟合且参数值是否合理。

方程

膨胀系数 = (1.07764 - 0.122693 * 开尔文温度 + 0.00408638 * 开尔文温度 ** 2 - 1.42627E-06 * 开尔文温度 ** 3) / (1
     - 0.00576099 * 开尔文温度 + 0.000240537 * 开尔文温度 ** 2 - 1.23144E-07 * 开尔文温度 ** 3)
主要结果:方程

在这些结果中,存在一个预测变量和七个参数估计值。响应变量是膨胀量,预测变量是开尔文温度。这个冗长的方程描述了响应变量和预测变量之间的关系。开尔文温度每提高一度对于铜膨胀的影响高度取决于起始温度。变化的温度对铜膨胀的影响作用不太容易总结。请评估拟合线图来查看预测变量和响应变量之间的关系。

如果向方程中输入开尔文温度值,结果为铜膨胀的拟合值。

步骤 3:确定模型对数据的拟合优度

要确定模型对数据的拟合优度,请检查模型汇总表和失拟表中的统计量。

S

使用 S 可评估模型描述响应值的程度。

S 以响应变量的单位进行度量,它表示数据值与拟合值的距离。S 值越低,模型描述响应的程度越高。但是,自身低 S 值并不表明模型符合模型假设。您应检查残差图来验证假设。

失拟

当数据包含仿行时,Minitab 会自动显示失拟表。仿行是多个具有相同预测变量值的观测值。如果您的数据不包含仿行,那么不可能计算执行此检验所需的纯误差。仿行的不同响应值代表纯误差,因为只有随机变异可以导致观测响应值之间的差异。

要确定模型是否正确地指定响应与预测变量之间的关系,请将失拟检验的 p 值与显著性水平进行比较以评估原假设。失拟检验的原假设声明模型正确指定了响应与预测变量之间的关系。通常,显著性水平(用 alpha 或 α 表示)为 0.05 即可。显著性水平 0.05 指示在模型正确指定响应与预测变量之间的关系时得出模型未正确指定此关系的风险为 5%。
P 值 ≤ α:失拟在统计意义上显著
如果 p 值小于或等于显著性水平,则得出模型未正确指定关系的结论。要改善模型,可能需要添加项或者变换数据。
P 值 > α:失拟在统计意义上不显著

如果 p 值大于显著性水平,则检验不检测任何失拟。

失拟

来源自由度SSMSFP
误差2291.532440.0066919   
  失拟2281.525830.00669221.010.679
  纯误差10.006610.0066125   

汇总

迭代15
最终 SSE1.53244
DFE229
MSE0.0066919
S0.0818039
* 警告 * 某些参数估计值高度相关。考虑简化期望函数或变换预测变量或参数以减少共线性。
主要结果:S、失拟

在这些结果中,S 指示数据值和拟合值之间的距离标准差约为 0.08 个单位。失拟检验的 P 值为 0.679,这就没有证据表明模型对数据的拟合效果很差。

步骤 4:确定模型是否符合分析的假设条件

使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。

有关如何处理残差图模式的更多信息,请转到非线性回归的残差图,然后单击页面顶部列表中残差图的名称。

残差与拟合值图

使用残差与拟合值图可验证残差随机分布和具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。

下表中的模式可能表示该模型不满足模型假设。
模式 模式的含义
残差相对拟合值呈扇形或不均匀分散 异方差
曲线 缺少高阶项
远离 0 的点 异常值
在 X 方向远离其他点的点 有影响的点
在此残差与拟合值图中,数据似乎随机分布在零附近。没有证据表明残差值取决于拟合值。

残差与顺序图

使用残差与顺序图可验证残差独立于其他残差的假设。当以时序显示时,独立残差不显示趋势或模式。点中的模式可能表明,彼此相近的残差可能相关联,因此并不独立。理想情况下,图中的残差应围绕中心线随机分布:
如果查看模式,便可查出原因。下列类型的模式可能表明残差属于依赖项。
趋势
偏移
周期
在此残差图和顺序图中,残差似乎会围绕中心线随机衰减。没有证据表明残差为非独立的。

残差的正态概率图

使用残差正态概率图可验证残差呈正态分布的假设。残差的正态概率图应该大致为一条直线。

下表中的模式可能表示该模型不满足模型假设。
模式 模式的含义
非直线 非正态性
远离直线的点 异常值
斜率不断变化 未确定的变量
在此正态概率图中,点通常为一条直线。没有证据表明存在非正态性、异常值或未确定的变量。