Especificar los métodos predeterminados para Clasificación
TreeNet®. Los cambios que haga en los valores predeterminados se mantendrán vigentes hasta que los cambie de nuevo, incluso después de salir de Minitab.
Criterio
para seleccionar un número óptimo de árboles con respuesta binaria
Elija el método para generar el modelo óptimo. Puede comparar los resultados de varios métodos para determinar la mejor opción para el uso específico.
Máxima
log-verosimilitud: El método de máxima verosimilitud encuentra el máximo de funciones de verosimilitud para los datos.
Máxima área bajo
la curva ROC: El método de área máxima bajo la curva ROC funciona adecuadamente en muchas aplicaciones. El área bajo la curva ROC mide qué tan efectivo es el modelo para clasificar las filas de la fila con mayor probabilidad de generar un evento a la que tiene menor probabilidad. Esta opción está disponible con una respuesta binaria.
Tasa
mínima de clasificación errónea: Seleccione esta opción para mostrar los resultados del modelo que minimiza la tasa de clasificaciones erróneas. La tasa de clasificaciones erróneas se basa en un conteo simple de la frecuencia con la que el modelo predice un caso de forma correcta o incorrecta.
Criterio para seleccionar un número óptimo de
árboles con respuesta multinomial
Elija el método para generar el modelo óptimo. Puede comparar los resultados de varios métodos para determinar la mejor opción para el uso específico.
Tasa
mínima de clasificación errónea: Seleccione esta opción para mostrar los resultados del modelo que minimiza la tasa de clasificaciones erróneas. La tasa de clasificaciones erróneas se basa en un conteo simple de la frecuencia con la que el modelo predice un caso de forma correcta o incorrecta.
Máxima
log-verosimilitud: El método de máxima verosimilitud encuentra el máximo de funciones de verosimilitud para los datos.
Máximo de
nodos terminales por árbol y Profundidad
máxima del árbol
También puede limitar el tamaño de los árboles. Elija una de las siguientes opciones para limitar el tamaño de los árboles.
Máximo de
nodos terminales por árbol: Ingrese un valor entre 2 y 2000 para representar el número máximo de nodos terminales de un árbol. En general, 6 es un valor que proporciona buen equilibrio entre la velocidad de cálculo y la investigación de interacciones entre variables. Un valor de 2 elimina la investigación de las interacciones.
Profundidad
máxima del árbol: Ingrese un valor entre 2 y 1000 para representar la profundidad máxima de un árbol. El nodo raíz corresponde a una profundidad de 1. En muchas aplicaciones, las profundidades de 4 a 6 proporcionan modelos razonablemente adecuados.
Penalización por valor faltante
Indique un valor de penalización para un predictor con valores faltantes Debido a que es más fácil ser un buen divisor con menos datos, los predictores con datos faltantes tienen una ventaja sobre los predictores sin datos faltantes. Utilice esta opción para penalizar a los predictores con datos faltantes.
0.0 ≤ K ≤ 2.0, por ejemplo:
K = 0: Especifica que no hay penalización.
K = 2: Especifica la penalización más alta.
Penalización por categoría de nivel alto
Introduzca un valor de penalización para predictores categóricos que tengan muchos valores. Debido a que los predictores categóricos con muchos niveles pueden distorsionar un árbol debido a su mayor poder de división, tienen una ventaja sobre los predictores con menos niveles. Utilice esta opción para penalizar los predictores con muchos niveles.