Métodos y fórmulas para la gráfica de elevación acumulada para Clasificación Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

El procedimiento para el cálculo de la elevación acumulada depende del método de validación. Para una variable de respuesta multinomial, Minitab muestra múltiples gráficas que tratan a cada clase como el evento en turno.

Out-of-bag

Para un árbol determinado en el bosque, un voto de clase para una fila de los datos out-of-bag es la clase pronosticada para la fila del árbol individual. La clase pronosticada para una fila de los datos out-of-bag es la clase con el voto más alto en todos los árboles del bosque. La probabilidad de clase pronosticada para una fila de los datos out-of-bag es la relación entre el número de votos de la clase y el total de votos para la fila.

Para la curva de los datos out-of-bag, cada punto de la gráfica representa una probabilidad de clase pronosticada distinta. La probabilidad del evento más alta es el primer punto de la gráfica y aparece más a la izquierda. Las otras probabilidades están en orden decreciente.

Los puntos de la gráfica de elevación acumulada se derivan del cálculo de los puntos en la gráfica de la curva ROC. La coordenada y de la gráfica de elevación acumulada es (tasa de verdaderos positivos en porcentaje / % acumulado de población en la coordenada x). El cálculo de la tasa de verdaderos positivos es exactamente el mismo que para la gráfica de la curva ROC.

La coordenada x de la gráfica tiene la siguiente forma:

donde es el número de filas donde la probabilidad ajustada es mayor que el umbral y N es el número total de filas. Para obtener más detalles acerca de los umbrales, vaya a Métodos y fórmulas para la gráfica de la curva característica operativa del receptor (ROC) para Clasificación Random Forests®.

Separar el conjunto de datos

Utilice los mismos pasos que en el caso del conjunto de entrenamiento, pero calcule las probabilidades del evento a partir de los casos para el conjunto de prueba.