拟合二元 Logistic 模型的接受者抽检特征 (ROC) 曲线

ROC 曲线在 y 轴上绘制真阳率 (TPR),也称为功效。ROC 曲线在 x 轴上绘制假阳率 (FPR),也称为 1 类错误。ROC 曲线下面积指示二元模型是否为良好的分类器。

解释

ROC 曲线下面积的值范围是 0.5 到 1。当二元模型可以完美地分隔类时,曲线下面积为 1。当二元模型不能比随机分配更好地分隔类时,曲线下面积为 0.5。

不使用单独的检验集时,Minitab 会使用数据集创建 ROC 曲线。

在本示例中,检验曲线下面积为 0.9405。

使用验证方法时,Minitab 会创建两条 ROC 曲线。一条曲线用于训练数据,另一条曲线用于验证数据。检验结果指示模型是否可以充分预测新观测值的响应值,或是否可以正确汇总响应变量和预测变量之间的关系。训练结果通常比实际情况更理想,仅供参考。

明显小于 ROC 曲线下面积的 K 折叠 ROC 曲线下面积可能表示模型过度拟合。当模型包含总体中不重要的项时,将出现过度拟合模型。该模型变为根据训练数据定制的模型,因此对于预测总体数据可能没有用。

在此示例中,训练曲线显示的拟合优于检验曲线。检验曲线的性能通常能够更好地表示模型拟合新数据的程度。检验曲线下面积为 0.8882。