解释拟合 Poisson 模型的主要结果

要解释 Poisson 回归模型,请完成以下步骤。主要输出包括 P 值、系数、模型汇总统计量及残差图。

步骤 1:确定响应变量和项之间的关联在统计意义上是否显著

要确定响应与模型中每个项之间的关联在统计意义上是否显著,请将该项的 P 值与显著性水平进行比较以评估原假设。原假设声明该项与响应之间没有关联。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应变量与项之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 p 值大于显著性水平,则无法得出响应变量与该项之间的关联在统计意义上显著的结论。您可能希望重新拟合没有该项的模型。
如果多个预测变量与响应在统计意义上没有显著的关联,则可以通过删除项(一次删除一个)来简化模型。有关从模型中删除项的更多信息,请转到模型简化
如果一个模型项在统计意义上显著,则解释取决于该项的类型。解释如下所示:
  • 如果一个连续预测变量显著,则可以得出该预测变量的系数不是零的结论。
  • 如果一个类别变量显著,则可以得出并非所有水平都具有相同的平均事件数的结论。
  • 如果一个交互作用项显著,则可以得出预测变量与事件数之间的关系取决于该项中的其他预测变量的结论。
  • 如果一个多项式项显著,则可以得出预测变量与事件数之间的关系取决于预测变量的量级的结论。

方差分析



Wald 检验
来源自由度卡方P 值
回归356.290.000
  清洁小时数14.740.029
  温度138.460.000
  螺丝钉大小113.090.000

系数

系数系数标准误Z 值P 值方差膨胀因子
常量4.39820.062870.020.000 
清洁小时数0.017980.008262.180.0291.00
温度-0.0019740.000318-6.200.0001.00
螺丝钉大小         
  小-0.15460.0427-3.620.0001.00
主要结果:P 值、系数

在这些结果中,在 0.05 水平下,所有三个预测变量在统计意义上显著。您可推断出这些变量的变化是与响应变量的变化相关的。

使用系数可以确定预测变量的变化会让事件发生的可能性变大还是变小。预测变量的估计系数表示当模型中的其他预测变量保持恒定时,预测变量发生一个单位的变化时链接函数的变化。系数和事件数之间的关系取决于几个方面的分析,包括模型中类别预测变量的链接函数和参考水平。一般而言,正系数会使事件发生的可能性变大,负系数会使事件发生的可能性变小。近于 0 的估计系数表明预测变量的效应较小或不存在。

类别预测变量的估计系数的解释相对于预测变量的参考水平。正系数表示事件在预测变量水平发生的可能性比在因子的参考水平发生的可能性大。负系数表示事件在预测变量水平发生的可能性比在参考水平发生的可能性小。

“清洁小时数”的系数为正,这表示小时数越多,响应值越大。温度的系数为负,这表示温度越高,响应值越小。

螺丝钉大小是具有一个系数的类别变量,这表示该变量有 2 个水平并使用 0、1 进行编码。小螺丝钉的系数为负,所以小螺丝钉与比参考水平小的响应值相关。

如果一个交互作用项具有统计显著性,则预测变量与响应变量之间的关系将因其他预测变量的水平而异。在这种情况下,不应在不考虑交互作用效应时解释主效应。要更好地了解模型中的主效应、交互作用效应和弯曲,请转到因子图响应优化器

步骤 2:确定模型是否无法与数据拟合

使用拟合优度检验确定预测事件数是否以 Poisson 分布无法预测的方式偏离观测事件数。如果拟合优度检验的 P 值低于您所选的显著性水平,则您可以否定 Poisson 分布能够提供良好拟合的原假设。此列表提供偏离的常见原因:
  • 不正确的链接函数
  • 忽略了模型中变量的高阶项
  • 忽略了模型中不存在的预测变量
  • 过度离散

如果偏离在统计上显著,则您可以尝试另一种链接函数或更改模型中的项。

拟合优度检验

检验自由度估计均值卡方P 值
偏差3231.607220.9877331.610.486
Pearson3231.267130.9771031.270.503
主要结果:Deviance 检验、Pearson 检验

在这些结果中,这两个拟合优度检验的 P 值都大于常见显著性水平 .05。没有足够的证据可以断定预测的事件数偏离观测的事件数。

步骤 3:确定模型对数据的拟合优度

使用 AIC、AICc 和 BIC 比较不同的模型。对于各统计量,值越小越合意。但是,对于预测变量集具有最小值的模型,不一定需要很准确地拟合数据。而且,还可使用拟合优度检验和残差图评估模型与数据的拟合优度。

模型汇总

偏差 R-Sq偏差 R-Sq (调整)AICAICcBIC
64.20%60.80%253.29254.58259.62

系数

系数系数标准误Z 值P 值方差膨胀因子
常量4.39820.062870.020.000 
清洁小时数0.017980.008262.180.0291.00
温度-0.0019740.000318-6.200.0001.00
螺丝钉大小         
  小-0.15460.0427-3.620.0001.00
主要结果:AIC

在第一组结果中,AIC 约为 253。AICc 大约为 255。BIC 大约为 260。此模型不包括温度和螺丝钉大小之间的交互作用项。来自单个模型的信息标准不指示模型对数据的拟合优度,因为值依赖样本数量。

模型汇总

偏差 R-Sq偏差 R-Sq (调整)AICAICcBIC
85.99%81.46%236.05238.05243.97

系数

系数系数标准误Z 值P 值方差膨胀因子
常量4.57600.073662.150.000 
清洁小时数0.017980.008262.180.0291.00
温度-0.0032850.000441-7.460.0001.92
螺丝钉大小         
  小-0.54440.0990-5.500.0005.37
温度*螺丝钉大小         
  小0.0028040.0006404.380.0006.64

在第二组结果中,AIC 约为 236。AICc 大约为 238。BIC 大约为 244。此模型包括温度和螺丝钉大小之间的交互作用项。值越小,具有交互作用项的模型执行得越好。