二值 Logistic 回归的受试者工作特征 (ROC) 曲线 拟合二元 Logistic 模型

ROC 曲线在 y 轴上绘制真阳率 (TPR),也称为功效。ROC 曲线在 x 轴上绘制假阳率 (FPR),也称为 1 类错误。ROC 曲线下面积指示二元模型是否为良好的分类器。

解释

ROC 曲线下面积的值范围是 0.5 到 1。当二元模型可以完美地分隔类时,曲线下面积为 1。当二元模型不能比随机分配更好地分隔类时,曲线下面积为 0.5。

不使用单独的检验集时,Minitab 会使用数据集创建 ROC 曲线。

在本示例中,检验曲线下面积为 0.9405。

使用验证方法,Minitab 会创建两条 ROC 曲线。一条曲线用于训练数据,另一条曲线用于验证数据。验证结果表明模型是否能够充分预测新观测值的响应值,或者是否能够正确汇总响应变量与预测变量之间的关系。训练结果通常比实际情况更理想,仅供参考。

ROC 曲线下的 k 折叠面积明显小于 ROC 曲线下的面积可能表示模型过度拟合。当模型包含总体中不重要项时,将出现过度拟合模型。该模型变为根据训练数据定制的模型,因此对于总体预测可能没有帮助。

在此示例中,训练曲线显示的拟合度优于测试曲线。测试曲线的性能通常可以更好地表示模型对新数据的性能。检验曲线下面积为 0.8882。