Efectividad de la clasificación para Clasificación CART®

Seleccione el método o la fórmula de su elección.

Estas estadísticas aparecen en la tabla que muestra la efectividad de la clasificación para los mejores y peores nodos terminales. En general, las filas están en orden por el tamaño de las probabilidades de clase. Los valores dentro de 1E-12 son empates. Minitab ordena los empates por sus conteos ponderados. Si los conteos ponderados también son empates, Minitab ordena los empates por el ID de nodo.

% de N

La siguiente fórmula proporciona el porcentaje de los datos que se encuentran en el nodo. Esta fórmula es para datos sin ponderaciones:

La siguiente fórmula es para datos con ponderaciones:

Notación

TérminoDescription
número de casos en el nodo k
Nnúmero de casos en el conjunto de datos
ponderación para el j-ésimo caso en el nodo
ponderación para el i-ésimo caso en el conjunto de datos

Prob. del evento y prob. del no evento

Minitab se refiere a la probabilidad del evento y la probabilidad del no evento para las variables de respuesta binaria.
La siguiente fórmula proporciona los eventos de porcentaje en el nodo. Esta fórmula es para datos sin ponderaciones:

La siguiente fórmula es para datos con ponderaciones:

La probabilidad del no evento tiene la siguiente definición:

Notación

TérminoDescription
número de eventos en el nodo k
número de casos en el nodo k
ponderación para el j-ésimo evento en el nodo
ponderación para el i-ésimo observación en el nodo

Prob. de clase y prob. de no clase

Minitab se refiere a la probabilidad de clase y la probabilidad no de clase para las variables de respuesta multinomial.
La siguiente fórmula proporciona el porcentaje de una clase en el nodo. Esta fórmula es para datos sin ponderaciones.

La siguiente fórmula es para datos con ponderaciones:

La probabilidad de no clase tiene la siguiente definición:

Notación

TérminoDescription
número de casos en una clase y en el nodo k
número de casos en el nodo k
ponderación para el j-ésimo caso en clase y en el nodo
ponderación para el i-ésimo caso en el nodo

Probabilidades

La fórmula para las probabilidades depende de si la variable de respuesta es binaria o multinomial.

Variable de respuesta binaria

Variable de respuesta multinomial