二元拟合线图的模型汇总统计量

在模型汇总表格中查找每个统计量的定义和解释指导。

偏差 R-Sq

偏差 R2 通常被视为由模型解释的响应变量中的偏差比率。

解释

偏差 R2 越高,模型拟合数据的优度越高。偏差 R2 始终在 0% 和 100%之间。

如果向模型添加其他预测变量,则偏差 R2 会始终增加。例如,最佳的 5 预测变量模型的 R2 始终比最佳的 4 预测变量模型的高(至少一样高)。因此,比较相同大小的模型时,偏差 R2 最有效。

偏差 R2 只是一个预测模型对数据拟合优度的度量标准。即使模型具有高 R2,您也应当检查残差图和拟合优度检验,以评估模型拟合数据的优度。

您可以使用拟合线图演示不同的偏差 R2 值。第一张图演示的模型解释了响应变量中约 96% 的偏差。第二张图演示的模型解释了响应变量中约 60% 的偏差。模型解释的偏差越多,数据点坐落的位置越靠近曲线。从理论上讲,如果模型可以解释 100% 的偏差,则拟合值将始终等于观测值,并且所有数据点都将落于曲线上。

数据格式会影响偏差 R2 值。偏差 R2 通常要高于事件/试验格式的数据。偏差 R2 值仅在使用相同数据格式的两个模型之间可比较。有关更多信息,请转到数据格式对二元 Logistic 回归中拟合优度的影响

偏差 R-Sq (adj)

调整的偏差 R2 是由模型解释的响应中偏差的比率,相对于观测值数,已调整了模型中的预测变量数。

解释

使用调整的偏差 R2 来比较具有不同预测变量数量的模型。如果向模型添加预测变量,偏差 R2 也会始终增加。调整的偏差 R2 值在模型中包含了预测变量数,以帮助您选择正确的模型。

例如,您效力于一家薯片公司,该公司正在检查影响碎薯片的因子。当您添加预测变量时,将得到以下结果:
步骤 马铃薯百分比 冷却速度 加工温度 偏差 R2 调整的偏差 R2 P 值
1 X     52% 51% 0.00
2 X X   63% 62% 0.00
3 X X X 65% 62% 0.00

第一步产生在统计意义上显著的回归模型。第二步,向该模型中添加冷却速度,增大了调整的偏差 R2,这表示冷却速度可以改善该模型。第三步,向该模型中添加加工温度,增大了偏差 R2 而不是调整的偏差 R2。这些结果表示加工温度无法改善该模型。根据这些结果,您可以考虑从模型中删除加工温度。

对于二元 Logistic 回归,数据格式会影响调整的偏差 R2 值。对于相同的数据,调整的偏差 R2 在这些数据采用事件/试验格式时比在这些数据采用二元响应/频率格式时要大。仅使用调整的偏差 R2 比较具有相同数据格式的模型的拟合。有关更多信息,请转到数据格式对二元 Logistic 回归中拟合优度的影响

AIC

Akaike Information Criterion(赤池信息量准则)是针对模型中拟合与项数的模型相对质量的度量。没有对比值,统计量就没有解释。

解释

使用 AIC 比较不同的模型。AIC 越小,模型拟合数据的优度越高。但是,对于预测变量集具有最小 AIC 的模型,不一定需要很准确地拟合数据。而且,还可使用拟合优度检验和残差图评估模型与数据的拟合优度。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策