Especificar la configuración predeterminada para imprimir hojas de trabajo Clasificación TreeNet®

Archivo > Opciones > Analítica predictiva > Clasificación TreeNet®

Especificar el método de validación para Los cambios que haga en los valores predeterminados se mantendrán vigentes hasta que los cambie de nuevo, incluso después de salir de Minitab.

Elija el método para generar el modelo óptimo. Puede comparar los resultados de varios métodos para determinar la mejor opción para el uso específico.
  • Máxima log-verosimilitud: El método de máxima verosimilitud encuentra el máximo de funciones de verosimilitud para los datos.
  • Máxima área bajo la curva ROC: El método de área máxima bajo la curva ROC funciona adecuadamente en muchas aplicaciones. El área bajo la curva ROC mide qué tan efectivo es el modelo para clasificar los registros desde los más probables hasta los menos probables, según su probabilidad de producir un evento. Esta opción está disponible con una respuesta binaria.
  • Tasa mínima de clasificación errónea: Seleccione esta opción para mostrar los resultados del modelo que minimiza la tasa de clasificaciones erróneas. La tasa de clasificaciones erróneas se basa en un conteo simple de la frecuencia con la que el modelo predice un caso de forma correcta o incorrecta.
Elija el método para generar el modelo óptimo. Puede comparar los resultados de varios métodos para determinar la mejor opción para el uso específico.
  • Tasa mínima de clasificación errónea: Seleccione esta opción para mostrar los resultados del modelo que minimiza la tasa de clasificaciones erróneas. La tasa de clasificaciones erróneas se basa en un conteo simple de la frecuencia con la que el modelo predice un caso de forma correcta o incorrecta.
  • Máxima log-verosimilitud: El método de máxima verosimilitud encuentra el máximo de funciones de verosimilitud para los datos.
Máximo de nodos terminales por árbol y Profundidad máxima del árbol
También puede limitar el tamaño de los árboles. Elija una de las siguientes opciones para limitar el tamaño de los árboles.
  • Máximo de nodos terminales por árbol: ingrese un valor entre 2 y 2000 para representar el número máximo de nodos terminales de un árbol. Por lo general, el valor predeterminado de 6 proporciona un buen equilibrio entre la velocidad de cálculo y la investigación de las interacciones entre variables. Un valor de 2 elimina la investigación de las interacciones.
  • Profundidad máxima del árbol: Ingrese un valor entre 2 y 1000 para representar la profundidad máxima de un árbol. El nodo raíz corresponde a una profundidad de 1. En muchas aplicaciones, las profundidades de 4 a 6 proporcionan modelos razonablemente adecuados.
Penalización por valor faltante
Número de sustitutos para un predictor con valores faltantes Debido a que es más fácil ser un buen divisor con menos datos, los predictores con datos faltantes tienen una ventaja sobre los predictores sin datos faltantes. Utilice esta opción para penalizar a los predictores con datos faltantes.
0,0 ≤ K ≤ 2,0, por ejemplo:
  • K > 0 No especifica ninguna penalización.
  • K > 2 Especifica la sanción más alta.
Penalización por categoría de nivel alto
Introduzca un valor de penalización para los predictores categóricos que tienen muchos valores. Debido a que los predictores categóricos con muchos niveles pueden distorsionar un árbol debido a su mayor poder de división, tienen una ventaja sobre los predictores con menos niveles. Utilice esta opción para penalizar a los predictores con muchos niveles.
0,0 ≤ K ≤ 5,0, por ejemplo:
  • K > 0 No especifica ninguna penalización.
  • K > 5 Especifica la sanción más alta.
Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado.  Leer nuestra política