Métodos y fórmulas para la gráfica de ganancia para Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

El procedimiento para los puntos en la gráfica de ganancia depende del método de validación. Para una variable de respuesta multinomial, Minitab muestra múltiples gráficas que tratan a cada clase como el evento en turno.

Sin validación

Para la gráfica de un conjunto de datos de entrenamiento, cada punto de la gráfica representa una probabilidad del evento ajustada distinta. La probabilidad del evento más alta es el primer punto de la gráfica y aparece más a la izquierda. Los otros puntos de la gráfica están en orden decreciente de probabilidad del evento.

La coordenada y de la gráfica de ganancia es la tasa de verdaderos positivos en una escala porcentual. El cálculo de la tasa de verdaderos positivos es el mismo que para la gráfica de la curva ROC. La coordenada x de la gráfica tiene la siguiente forma:

donde es el número de filas donde la probabilidad ajustada es mayor que el umbral y N es el número total de filas. Para obtener más detalles acerca de los umbrales, vaya a Métodos y fórmulas para la gráfica de la curva característica operativa del receptor (ROC) para Ajustar modelo y Descubrir predictores clave con Clasificación TreeNet®.

Separar el conjunto de datos

Utilice los mismos pasos que en el caso del conjunto de entrenamiento, pero calcule las probabilidades del evento a partir de los casos para el conjunto de prueba.

Prueba de validación cruzada con k-fold

Utilice los mismos pasos que en el procedimiento del conjunto de datos de entrenamiento, pero calcule las probabilidades del evento de los casos para el conjunto de datos con validación cruzada.