Evaluación del modelo mediante la eliminación de predictores sin importancia o importantes para Descubrir predictores clave con Regresión TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Buscar definiciones y orientación para interpretar la tabla de evaluación del modelo.
Nota

Cuando se especifican las opciones para la eliminación del predictor, se elige si se deben incluir los datos de entrenamiento con los resultados de los datos de prueba. Los resultados de prueba indican si el modelo puede predecir adecuadamente los valores de respuesta para nuevas observaciones o resumir correctamente las relaciones entre la respuesta y las variables predictoras. Los resultados de entrenamiento en general son solo de referencia.

Utilice los resultados para comparar los modelos a partir de diferentes pasos. Para explorar más a fondo un modelo alternativo de la tabla, haga clic en Seleccione un modelo alternativo. Minitab produce un conjunto completo de resultados para el modelo alternativo. Puede ajustar los hiperparámetros y realizar predicciones a partir de los resultados del modelo alternativo.

Número óptimo de árboles

El número óptimo de árboles suele diferir en cada paso. Cuando el número óptimo está cerca del número máximo de árboles para el análisis, es más probable que el modelo mejore si aumenta el número de árboles que un modelo con un número óptimo de árboles que está lejos del máximo. Puede considerar la opción de explorar más a fondo un modelo alternativo que tenga la probabilidad de mejorar.

R-cuadrada (%)

R2 es el porcentaje de variación en la respuesta explicado por el modelo. Los valores atípicos tienen mayor efecto en R2 que en MAD.

Cuando se utiliza la función de pérdida de errores cuadradas o la función de pérdida Huber, la tabla incluye el valor de R2 para cada modelo. Los resultados siguientes son para el modelo con el valor de R2 más alto. Si un modelo con un número más pequeño de términos tiene un valor de R2 cercano al valor óptimo, considere si desea explorar más a fondo el modelo alternativo. Un modelo con menos predictores es más fácil de interpretar, puede tener una mejor precisión de predicción y le permite centrarse en un número más pequeño de predictores para observar o controlar.

MAD

La desviación absoluta media (MAD) es el promedio del valor absoluto de la diferencia entre un valor pronosticado y un valor real. Mientras más pequeña sea la MAD, mejor se ajustará el modelo a los datos. La MAD expresa precisión en las mismas unidades que los datos, lo cual ayuda a conceptualizar la cantidad de error. Los valores atípicos tienen menos efecto en la MAD que en R2.

Cuando se utiliza la función de pérdida de la desviación absoluta, la tabla incluye el valor de MAD para cada modelo. Los resultados completos que siguen a la tabla son para el modelo con el menord valor de MAD. Si un modelo con un número más pequeño de términos tiene un valor de MAD cercano al valor óptimo, considere si desea explorar más a fondo el modelo alternativo. Un modelo con menos predictores es más fácil de interpretar, puede tener una mejor precisión de predicción y le permite centrarse en un número más pequeño de predictores para observar o controlar.

Conteo de predictores

El conteo de predictores es el número de predictores en el modelo. El número de predictores en la primera fila de la tabla siempre equivale a todos los predictores considerados en el análisis. Después de la primera fila, el número de predictores depende de si el análisis elimina predictores sin importancia o predictores importantes.

Cuando el análisis elimina los predictores menos importantes, el número de predictores disminuye según el número de predictores especificado en cada paso, además de los predictores que tienen 0 importancia. Por ejemplo, si el análisis elimina 10 predictores por paso, tiene 900 predictores y 450 predictores sin importancia en el modelo inicial, la primera fila de la tabla tiene 900 predictores. La segunda fila tiene 440 predictores porque el análisis elimina los 450 predictores sin importancia y los 10 predictores sin importancia.

Cuando el análisis elimina los predictores más importantes, el número de predictores disminuye según el número de predictores especificado en cada paso. Los predictores que tienen 0 importancia permanecen en el modelo.

Predictores eliminados

La columna muestra los predictores eliminados en cada paso. La lista muestra como máximo 25 títulos predictores en un paso. La primera fila siempre muestra "Ninguno" porque el modelo tiene todos los predictores. Después de la primera fila, el número de predictores depende de si el análisis elimina predictores sin importancia o predictores importantes.

Cuando el análisis elimina los predictores menos importantes, el número de predictores disminuye según el número de predictores especificado en cada paso, además de los predictores que tienen 0 importancia. Si el análisis elimina los predictores que tienen 0 importancia, entonces esos predictores son los primeros en la lista. Cuando el análisis elimina más de un predictor en cada categoría, el orden de los nombres es el orden de los predictores de la hoja de cálculo.

Cuando el análisis elimina los predictores más importantes, la lista muestra los predictores eliminados de cada paso. Cuando el análisis elimina más de un predictor importante en un paso, el orden de los nombres en la lista es el orden de los predictores de la hoja de trabajo.