La curva ROC representa la tasa de verdaderos positivos (TPR), también conocida como potencia, en el eje Y. La curva ROC representa la tasa de falsos positivos (FPR), también conocida como error de tipo 1, en el eje X. El área bajo una curva ROC indica si el modelo binario es un buen clasificador.
El área bajo los valores de la curva ROC oscila entre 0.5 y 1. Cuando el modelo binario puede separar perfectamente las clases, entonces el área debajo de la curva es 1. Cuando el modelo binario no puede separar las clases mejor que una asignación aleatoria, el área debajo de la curva es 0.5.
Con un método de validación, Minitab crea dos curvas ROC. Una curva es para los datos de entrenamiento y la otra es para los datos de validación. Los resultados de validación indican si el modelo puede predecir adecuadamente los valores de respuesta para nuevas observaciones o resumir correctamente las relaciones entre la respuesta y las variables predictoras. Los resultados de entrenamiento suelen ser más ideales que reales y son solo para referencia.
Un área de k-fold bajo la curva ROC que es sustancialmente menor que el área bajo la curva ROC puede indicar que el modelo está sobreajustado. Un modelo sobreajustado ocurre cuando el modelo incluye términos que no son importantes en la población. El modelo se adapta al conjunto de datos de entrenamiento y, por lo tanto, puede no ser útil para hacer predicciones sobre la población.