Gráfica de ganancia y gráfica de elevación para Clasificación Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Utilice las gráficas de ganancia y elevación para evaluar el rendimiento de su modelo de clasificación. La gráfica de ganancia presenta la tasa de verdaderos positivos en porcentaje frente al porcentaje de conteos totales. La gráfica de elevación muestra la elevación acumulada (o elevación no acumulada) frente al porcentaje de conteos totales.

Interpretación de la gráfica de ganancia

La línea out-of-bag representa la respuesta esperada mediante el modelo predictivo. La línea de referencia punteada representa una línea con pendiente = 1, que es la respuesta aleatoria esperada sin el modelo.

En este ejemplo, la gráfica de ganancia muestra un fuerte aumento por encima de la línea de referencia y, luego, un aplanamiento. En este caso, aproximadamente 40% de los datos representan aproximadamente 78% de los verdaderos positivos. Por lo tanto, si una empresa se enfoca en el 20% de la población guiada por el modelo, el porcentaje de la tasa de verdaderos positivos es aproximadamente 40%. Sin el modelo, el porcentaje correspondiente es 20%. Esta diferencia es la ganancia adicional que se obtiene al utilizar el modelo.

Interpretación de la gráfica de elevación

La línea out-of-bag representa la respuesta esperada mediante el modelo predictivo. Elevación es la relación entre el porcentaje de ganancia en relación con el resultado aleatorio esperado. La línea de referencia punteada representa una elevación acumulada de 1, lo que significa que no hay ganancia en comparación con la asignación aleatoria.

En este ejemplo, la gráfica de elevación muestra un gran aumento por encima de la línea de referencia que disminuye gradualmente. Por lo tanto, utilizando este modelo, si contactáramos al 10% de los clientes con las mayores probabilidades pronosticadas para responder, esperamos recibir más del doble de respuestas de las que esperaríamos si contactamos al 10% de los clientes de manera aleatoria.