Gráfica de ganancia y gráfica de elevación para Clasificación CART®

Utilice las gráficas de ganancia y elevación para evaluar el rendimiento de su modelo de clasificación. La gráfica de ganancia traza la tasa positiva total en porcentaje frente al porcentaje de conteos totales. Así, por ejemplo, estas gráficas pueden mostrar que 80% de los eventos están en 20% de los datos. Por lo tanto, al centrarnos en 20% de los datos, podemos ser eficientes con nuestros recursos. La gráfica de elevación traza la elevación acumulada (o elevación no acumulada) frente al porcentaje de conteos totales.

Interpretación de la gráfica de ganancia

Las líneas de entrenamiento y prueba representan la respuesta esperada mediante el modelo predictivo. El conjunto de datos de entrenamiento se ajusta al modelo y el conjunto de datos de prueba evalúa el modelo. La línea de referencia punteada representa una línea con pendiente = 1, que es la respuesta aleatoria esperada sin el modelo. Las ganancias mayores que 1 indican que los resultados del modelo predictivo son mejores que aleatorios.

En este ejemplo, la gráfica de ganancia muestra un fuerte aumento por encima de la línea de referencia y, luego, un aplanamiento. En este caso, aproximadamente 40% de los datos representan aproximadamente 70% de los verdaderos positivos.

Interpretación de la gráfica de elevación

Las líneas de entrenamiento y prueba representan la respuesta esperada mediante el modelo predictivo. El conjunto de datos de entrenamiento se ajusta al modelo y el conjunto de datos de prueba evalúa el modelo. Elevación es la relación entre el porcentaje de ganancia en relación con el resultado aleatorio esperado. La línea de referencia punteada representa una elevación acumulada de 1, lo que significa que no hay ganancia en comparación con el resultado aleatorio.

En este ejemplo, la gráfica de elevación muestra un aumento por encima de la línea de referencia que se reduce gradualmente.