解释拟合 Poisson 模型的主要结果

要解释 Poisson 回归模型,请完成以下步骤。主要输出包括 P 值、系数、模型汇总统计量及残差图。

步骤 1:确定响应变量和项之间的关联是否存在统计上非常显著的关系

要确定响应与模型中每个项之间的关联在统计意义上是否显著,请将该项的 P 值与显著性水平进行比较以评估原假设。原假设声明该项与响应之间没有关联。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在关联时得出存在关联的风险为 5%。
P 值 ≤ α:关联在统计意义上显著
如果 P 值小于或等于显著性水平,则可以得出响应变量与项之间的关联在统计意义上显著的结论。
P 值 > α:关联在统计意义上不显著
如果 p 值大于显著性水平,则无法得出响应变量与该项之间的关联在统计意义上显著的结论。您可能希望重新拟合没有该项的模型。
如果多个预测变量与响应在统计意义上没有显著的关联,则可以通过删除项(一次删除一个)来简化模型。有关从模型中删除项的更多信息,请转到模型简化
如果一个模型项在统计意义上显著,则解释取决于该项的类型。解释如下所示:
  • 如果一个连续预测变量显著,则可以得出该预测变量的系数不是零的结论。
  • 如果一个类别变量显著,则可以得出并非所有水平都具有相同的平均事件数的结论。
  • 如果一个交互作用项显著,则可以得出预测变量与事件数之间的关系取决于该项中的其他预测变量的结论。
  • 如果一个多项式项显著,则可以得出预测变量与事件数之间的关系取决于预测变量的量级的结论。
偏差表 来源 自由度 调整后偏差 调整后均值 卡方 P 值 回归 3 56.670 18.8900 56.67 0.000 清洁小时数 1 4.744 4.7444 4.74 0.029 温度 1 38.800 38.8000 38.80 0.000 螺丝钉大小 1 13.126 13.1256 13.13 0.000 误差 32 31.607 0.9877 合计 35 88.277
系数 方差膨 项 系数 系数标准误 胀因子 常量 4.3982 0.0628 清洁小时数 0.01798 0.00826 1.00 温度 -0.001974 0.000318 1.00 螺丝钉大小 小 -0.1546 0.0427 1.00
主要结果:P 值、系数

在这些结果中,所有三个预测变量在 0.05 水平处具有统计显著性。您可以断定这些变量的变化与响应变量的变化相关。

使用系数来确定预测变量中的变化使事件的可能性变更大还是更小。预测变量的估计系数代表预测变量中每个单位变化的链接函数的变化,而模型中的其他预测变量则保持不变。系数和事件数之间的关系取决于几个方面的分析,包括模型中类别预测变量的链接函数和参考水平。一般来说,正系数让事件的可能性更大,而负系数则让事件的可能性更小。近于 0 的估计系数表明预测变量的效应较小或不存在。

类别预测变量的估计系数的解释与预测变量的参考水平相关。正系数表明事件处于预测变量水平的可能性要大于因子参考水平。负系数表明事件处于预测变量水平的可能性要小于参考水平。

“清洁小时数”的系数为正,这表示小时数越多,响应值越大。温度的系数为负,这表示温度越高,响应值越小。

螺丝钉大小是具有一个系数的类别变量,这表示该变量有 2 个水平并使用 0、1 进行编码。小螺丝钉的系数为负,所以小螺丝钉与比参考水平小的响应值相关。

如果一个交互作用项具有统计显著性,则预测变量与响应变量之间的关系将因其他预测变量的水平而异。在这种情况下,您不应该在不考虑交互作用效应时解释主效应。要更好地了解模型中的主效应、交互作用效应和弯曲,请转到因子图响应优化器

步骤 2:确定模型是否无法与数据拟合

使用拟合优度检验确定预测事件数是否以 Poisson 分布无法预测的方式偏离观测事件数。如果拟合优度检验的 P 值低于您所选的显著性水平,则您可以否定 Poisson 分布能够提供良好拟合的原假设。此列表提供偏离的常见原因:
  • 不正确的链接函数
  • 忽略了模型中变量的高阶项
  • 忽略了模型中不存在的预测变量
  • 过度离散

如果偏离在统计上显著,则您可以尝试另一种链接函数或更改模型中的项。

拟合优度检验 检验 自由度 估计 均值 卡方 P 值 偏差 32 31.60722 0.98773 31.61 0.486 Pearson 32 31.26713 0.97710 31.27 0.503
主要结果:Deviance 检验、Pearson 检验

在这些结果中,这两个拟合优度检验的 P 值都大于常见显著性水平 .05。没有足够的证据可以断定预测的事件数偏离观测的事件数。

步骤 3:确定模型对数据的拟合优度

使用 AIC 比较不同的模型。AIC 越小,模型拟合数据的优度越高。但是,对于预测变量集具有最小 AIC 的模型,不一定需要很准确地拟合数据。而且,还可使用拟合优度检验和残差图评估模型与数据的拟合优度。

模型汇总 偏差 R-Sq 偏差 R-Sq (调整) AIC 64.20% 60.80% 253.29
系数 方差膨 项 系数 系数标准误 胀因子 常量 4.3982 0.0628 清洁小时数 0.01798 0.00826 1.00 温度 -0.001974 0.000318 1.00 螺丝钉大小 小 -0.1546 0.0427 1.00
主要结果:AIC

在第一组结果中,AIC 约为 253。此模型不包括温度和螺丝钉大小之间的交互作用项。单个 AIC 模型无法指示模型是好还是坏,因为值取决于样本数量。

模型汇总 偏差 R-Sq 偏差 R-Sq (调整) AIC 85.99% 81.46% 236.05
系数 方差膨 项 系数 系数标准误 胀因子 常量 4.5760 0.0736 清洁小时数 0.01798 0.00826 1.00 温度 -0.003285 0.000441 1.92 螺丝钉大小 小 -0.5444 0.0990 5.37 温度*螺丝钉大小 小 0.002804 0.000640 6.64

在第二组结果中,AIC 约为 236。此模型包括温度和螺丝钉大小之间的交互作用项。AIC 越小,具有交互作用项的模型执行得越好。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策