仅使用固定预测变量拟合 Cox 模型 的模型汇总表

请在模型汇总表中查找每个统计量的定义和解释指导。

模型摘要表包括两行。一行用于没有任何术语的模型的行。另一行用于具有分析中术语的模型。比较两行,以评估模型的改进与没有条款的模型的术语。使用带有术语的模型行来描述模型的性能。使用 AIC、AICC 和 BIC 将不同术语的模型进行比较。

对数似然

使用对数似然比较使用相同数据估计系数的两个模型。由于值为负,因此值越接近于 0,模型与数据拟合得越好。

当您向模型中添加项时,对数似然无法减小。例如,带术语的模型比没有术语的模型具有更高的日志可能性。两个模型之间的日志可能性值差异较大,表明模型对数据拟合的贡献更大。

当您比较两个模型与术语时,如果模型的术语数相同,则性能差异最为明显。使用系数表中的术语的 p 值来决定在模型中包含哪些术语。

R-sq

R2 是由模型解释的响应的变异百分比。

解释

使用 R2 可确定模型与数据的拟合程度。R2 值越高,模型与数据的拟合度越好。R2 始终介于 0% 和 100% 之间。

当解释 R2 值时,请考虑以下问题:
  • 如果向模型添加其他预测变量,则 R2 会始终增加。例如,最佳的五预测变量模型的 R2 始终比最佳的四预测变量模型的高。因此,比较相同大小的模型时 R2 最有效。
  • 样本数量较小则不能提供对于响应变量和预测变量之间关系强度的精确估计。如果需要 R2 更为精确,则应当使用较大的样本(通常为 40 或更多)。
  • 拟合优度统计量只是模型拟合数据优度的一种度量。即使模型具有合意的值,您也应当检查残差图,以验证模型是否符合模型假设。

AIC、AICc 和 BIC

Akaike 信息标准 (AIC)、更正的 Akaike 信息标准 (AICc) 和 Bayesian 信息标准 (BIC) 是针对模型相对质量的度量,说明模型中的拟合与项数。

解释

使用 AIC、AICc 和 BIC 比较不同的模型。值越小越合意。但是,对于预测变量集具有最小值的模型,不一定需要很准确地拟合数据。还需要使用检验和残差图来评估模型对数据的拟合优度。
AICc 和 AIC
当样本数量相对于模型中的参数个数较小时,AICc 的性能优于 AIC。AICc 的性能之所以更佳,是因为当模型中的参数太多时,如果样本数量相对较小,AIC 往往较小。通常,当样本数量相对于模型中的参数个数较大时,这两个统计量提供的结果相似。
AICc 和 BIC
AICc 和 BIC 评估模型的似然,然后将用来添加项的惩罚应用于模型。惩罚会降低趋势,以使模型过度拟合样本数据。趋势降低可能会生成性能通常更佳的模型。
一般准则是,当参数个数相对于样本数量较小时,BIC 对于添加每个参数所施加的惩罚比 AICc 大。在这些情况下,最小化 BIC 的模型往往比最小化 AICc 的模型小。
在一些常见情况(如筛选设计)下,参数个数相对于样本数量通常较大。在这些情况下,最小化 AICc 的模型往往比最小化 BIC 的模型小。例如,对于包含 13 个游程的明确筛选设计,在一组包含 6 个或多个参数的模型中,最小化 AICc 的模型往往比最小化 BIC 的模型小。
有关 AICC 和 BIC 的更多信息,请参阅伯纳姆和安德森。1
1 Burnham, K. P., & Anderson, D. R. (2004)。 Multimodel inference: Understanding AIC and BIC in model selection. Sociological Methods & Research, 33(2), 261-304. doi:10.1177/0049124104268644