Seleccionar las opciones de análisis para Clasificación CART®

Estadísticas > Analítica predictiva > Clasificación CART® > Opciones

Seleccione las opciones de análisis.

Node splitting method
Elija el método de división para generar el árbol de decisión. Puede comparar los resultados de varios métodos de división para determinar la mejor opción para la aplicación.
  • Gini: El método Gini es el método predeterminado. El método Gini funciona bien en muchas aplicaciones. El método Gini normalmente genera árboles que incluyen pequeños nodos con una alta concentración de la respuesta de interés.
  • Entropía: El método de entropía es proporcional al máximo de ciertas funciones de verosimilitud para el nodo.
  • Twoing: El método Twoing solo está disponible con una respuesta multinomial. El método Twoing normalmente genera divisiones más equilibradas que los métodos Gini o de entropía. Para una respuesta binaria, el método Twoing es igual que el método Gini.
  • Probabilidad de clase: El árbol de probabilidad tiende a ser más grande que el árbol de Gini. Utilice el método de probabilidad cuando le interese el rendimiento de algunos nodos principales.
Criterion for selecting optimal tree
Elija entre los siguientes criterios para seleccionar el árbol en los resultados. Puede comparar los resultados de diferentes árboles para determinar la mejor opción para su aplicación.
  • Costo mínimo de clasificación errónea: Seleccione esta opción para mostrar los resultados del árbol que minimiza el costo de clasificación errónea.
  • Within K standard errors of minimum misclassification cost; K=: Seleccione esta opción para mostrar los resultados del árbol más pequeño con un costo de clasificación errónea dentro de K errores estándares del costo mínimo de clasificación errónea. De forma predeterminada, K=1, por lo que los resultados son para el árbol más pequeño con un costo de clasificación errónea dentro de 1 error estándar del árbol con el costo mínimo de clasificación errónea.
Número de sustitutos para un predictor con valores faltantes
Ingrese el número de sustitutos que Minitab busca cuando un predictor tiene valores faltantes. Cuando muchos predictores tienen patrones similares de valores faltantes, se debe aumentar el número de sustitutos.
Este número representa el número máximo de sustitutos que Minitab busca; sin embargo, este número de sustitutos puede no ser encontrado realmente.
El valor predeterminado es 10.
Número mínimo de casos para dividir un nodo interno
Introduzca el número mínimo de casos que un nodo puede tener y aún dividirse en más nodos. El valor predeterminado es 10. Con tamaños de muestra más grandes, es conveniente aumentar este mínimo. Por ejemplo, si un nodo interno tiene 10 o más casos, Minitab intenta realizar una división. Si el nodo interno tiene 9 casos o menos, Minitab no intenta realizar una división.
El límite del nodo interno debe ser al menos el doble del límite del nodo terminal, pero las relaciones más grandes son mejores. Los límites del nodo interno de al menos 3 veces los límites del nodo terminal permiten un número razonable de divisores.
Número mínimo de casos permitidos para un nodo terminal
Introduzca el número mínimo de casos que pueden estar en un nodo terminal. El valor predeterminado es 3. Con tamaños de muestra más grandes, es conveniente aumentar este mínimo. Por ejemplo, si una división crearía un nodo con menos de 3 casos, Minitab no realiza una división.
Profundidad máxima del árbol
Introduzca un valor para representar la profundidad máxima de un árbol. El nodo raíz corresponde a una profundidad de 1. Si desea asegurarse de obtener el mejor árbol, debe permitir un árbol más profundo, aunque este puede ralentizar el procesamiento.
Ponderaciones
Escriba una columna que contenga las ponderaciones del caso. La columna debe tener el mismo número de filas que la columna de respuestas. Los valores deben ser ≥ 0. Minitab omite del análisis las filas que contienen valores faltantes o ceros.