Efectividad de la clasificación para los mejores y los peores nodos terminales para Clasificación CART®

Utilice las estadísticas de efectividad de la clasificación para caracterizar los nodos de especial interés debido a su rendimiento.

Minitab almacena una tabla para cada nivel de respuesta. Cada fila de la tabla muestra un resumen para un nodo. Para casos binarios y multinomiales, Minitab ordena las probabilidades de clase utilizando la expresión Abs(event probability – 0.5). Mientras más alto sea el valor, mejor será el nodo terminal. Los mejores nodos están en orden desde el mejor hasta el peor. Los peores nodos están en orden desde el peor hasta el mejor.

Si hay empates al usar las probabilidades de clase, Minitab utiliza % de N como segunda clasificación. El nodo terminal con el mayor % de N es el primero. Si todavía hay empates después de esta clasificación, Minitab muestra el nodo de terminal más pequeño primero en los escenarios “El mejor”, “El peor” y “El mejor y el peor”.
Nota

Incluso en la clasificación de nodos “El peor”, el desempate debe mostrar el mayor % N primero; por lo tanto, el orden “El mejor” y “El peor" no siempre será opuesto entre sí.

Cuando se utiliza un conjunto de datos de prueba, Minitab calcula estadísticos separados para los datos de entrenamiento y de prueba. Puede comparar los estadísticos para examinar el rendimiento relativo del árbol en los datos de entrenamiento y en nuevos datos. Los estadísticos de prueba suelen ser una mejor medida del rendimiento del árbol para nuevos datos. Los nodos terminales de Entrenamiento y Prueba se clasifican por separado en función de la probabilidad de evento de cada uno. Los nodos terminales que no tienen observaciones para los datos de Prueba no tienen ninguna probabilidad de evento, por lo tanto, estos nodos no se tienen en cuenta.

Nodo terminal
La identificación del nodo terminal.
Conteo de eventos o conteo de clases
El conteo es el número de casos en el nodo para el evento o no evento para la clase. Si el análisis incluye ponderaciones, el conteo es el conteo ponderado. Los nodos terminales con muchos casos pueden ser de especial interés porque estos nodos suelen representar casos más comunes.
Conteo total
El conteo total es el total de casos de eventos y no eventos o el total de todos los conteos de clases.
% de N
El porcentaje de datos en el nodo.
Prob. del evento o prob. de clase
La probabilidad de evento es para las variables de respuesta binaria y la probabilidad de clase es para las variables de respuesta multinomial.
Prob. del no evento o prob. de no clase
La probabilidad de no evento es para las variables de respuesta binarias y la probabilidad no de clase es para las variables de respuesta multinomial.
Probabilidades
Las probabilidades indican la relación entre la probabilidad del evento y el no evento o la clase con respecto a la no clase.