Evaluación del modelo mediante la eliminación de predictores sin importancia o importantes para Descubrir predictores clave con Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Buscar definiciones y orientación para interpretar la tabla de evaluación del modelo.
Nota

Cuando se especifican las opciones para la eliminación del predictor, se elige si se deben incluir los datos de entrenamiento con los resultados de los datos de prueba. Los resultados de prueba indican si el modelo puede predecir adecuadamente los valores de respuesta para nuevas observaciones o resumir correctamente las relaciones entre la respuesta y las variables predictoras. Los resultados de entrenamiento en general son solo de referencia.

Utilice los resultados para comparar los modelos a partir de diferentes pasos. Para explorar más a fondo un modelo alternativo de la tabla, haga clic en Seleccione un modelo alternativo. Minitab produce un conjunto completo de resultados para el modelo alternativo. Puede ajustar los hiperparámetros y realizar predicciones a partir de los resultados del modelo alternativo.

Número óptimo de árboles

El número óptimo de árboles suele diferir en cada paso. Cuando el número óptimo está cerca del número máximo de árboles para el análisis, es más probable que el modelo mejore si aumenta el número de árboles que un modelo con un número óptimo de árboles que está lejos del máximo. Puede considerar la opción de explorar más a fondo un modelo alternativo que tenga la probabilidad de mejorar.

Log-verosimilitud promedio

El promedio de log-verosimilitud es una medida de la precisión del modelo. Los valores más pequeños indican un mejor ajuste.

Cuando la respuesta es binaria, puede utilizar la máxima log-verosimilitud como criterio para la selección del mejor modelo. Los resultados completos que siguen a la tabla son para el modelo con el menor valor de log-verosimilitud promedio. Si un modelo con un número menor de términos tiene una log-verosimilitud promedio cercana al valor óptimo, considere si desea explorar más a fondo el modelo alternativo. Un modelo con menos predictores es más fácil de interpretar, puede tener una mejor precisión de predicción y le permite centrarse en un número más pequeño de predictores para observar o controlar.

Área bajo la curva ROC

La curva ROC representa la tasa de verdaderos positivos (TPR), también conocida como potencia, en el eje Y. La curva ROC representa la tasa de falsos positivos (FPR), también conocida como error de tipo 1, en el eje X. El área bajo una curva ROC indica si el modelo es un buen clasificador.

Para los árboles de clasificación, los valores del área bajo la curva ROC normalmente varían de 0.5 a 1. Valores más grandes indican un mejor modelo de clasificación. Cuando el modelo puede separar perfectamente las clases, el área bajo la curva es 1. Cuando el modelo no puede separar las clases mejor que una asignación aleatoria, el área bajo la curva es 0.5.

Cuando se utiliza el área máxima bajo la curva ROC como criterio para la selección del mejor modelo, la tabla incluye el área bajo la curva ROC para cada modelo. Los resultados completos que siguen a la tabla son para el modelo con el área más grande bajo la curva ROC. Si un modelo con un número más pequeño de términos tiene un valor cercano al valor óptimo, considere si desea explorar más a fondo el modelo alternativo. Un modelo con menos predictores es más fácil de interpretar, puede tener una mejor precisión de predicción y le permite centrarse en un número más pequeño de predictores para observar o controlar.

Tasa de clasificación errónea

La tasa de clasificación errónea indica la frecuencia con la que el modelo clasifica con precisión los valores de respuesta. Loa valores más pequeños indican mejor rendimiento.

Cuando se utiliza la tasa de clasificación errónea mínima como criterio para la selección del mejor modelo, la tabla incluye la tasa de clasificación errónea para cada modelo. Los resultados completos que siguen a la tabla son para el modelo con la menor tasa de clasificación errónea. Si un modelo con un número más pequeño de términos tiene un valor cercano al valor óptimo, considere si desea explorar más a fondo el modelo alternativo. Un modelo con menos predictores es más fácil de interpretar, puede tener una mejor precisión de predicción y le permite centrarse en un número más pequeño de predictores para observar o controlar.

Conteo de predictores

El conteo de predictores es el número de predictores en el modelo. El número de predictores en la primera fila de la tabla siempre equivale a todos los predictores considerados en el análisis. Después de la primera fila, el número de predictores depende de si el análisis elimina predictores sin importancia o predictores importantes.

Cuando el análisis elimina los predictores menos importantes, el número de predictores disminuye según el número de predictores especificado en cada paso, además de los predictores que tienen 0 importancia. Por ejemplo, si el análisis elimina 10 predictores por paso, tiene 900 predictores y 450 predictores sin importancia en el modelo inicial, la primera fila de la tabla tiene 900 predictores. La segunda fila tiene 440 predictores porque el análisis elimina los 450 predictores sin importancia y los 10 predictores sin importancia.

Cuando el análisis elimina los predictores más importantes, el número de predictores disminuye según el número de predictores especificado en cada paso. Los predictores que tienen 0 importancia permanecen en el modelo.

Predictores eliminados

La columna muestra los predictores eliminados en cada paso. La lista muestra como máximo 25 títulos predictores en un paso. La primera fila siempre muestra "Ninguno" porque el modelo tiene todos los predictores. Después de la primera fila, el número de predictores depende de si el análisis elimina predictores sin importancia o predictores importantes.

Cuando el análisis elimina los predictores menos importantes, el número de predictores disminuye según el número de predictores especificado en cada paso, además de los predictores que tienen 0 importancia. Si el análisis elimina los predictores que tienen 0 importancia, entonces esos predictores son los primeros en la lista. Cuando el análisis elimina más de un predictor en cada categoría, el orden de los nombres es el orden de los predictores de la hoja de cálculo.

Cuando el análisis elimina los predictores más importantes, la lista muestra los predictores eliminados de cada paso. Cuando el análisis elimina más de un predictor importante en un paso, el orden de los nombres en la lista es el orden de los predictores de la hoja de trabajo.