Visión general de Ajustar modelo y Descubrir predictores clave para Clasificación TreeNet®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Utilice la Clasificación TreeNet® para producir árboles de clasificación con potenciación del gradiente para una respuesta categórica con muchas variables predictoras continuas y categóricas. La Clasificación TreeNet® es un avance revolucionario en la tecnología de minería de datos desarrollado por Jerome Friedman, uno de los investigadores de minería de datos más destacados del mundo. Esta herramienta flexible y potente de minería de datos es capaz de generar consistentemente modelos extremadamente precisos con una velocidad excepcional y una alta tolerancia a datos desordenados e incompletos.

Por ejemplo, un investigador de mercado puede utilizar Clasificación TreeNet® para identificar a los clientes que tienen tasas de respuesta más altas a iniciativas específicas y pronosticar esas tasas de respuesta.

Clasificación CART® es una buena herramienta de análisis exploratorio de datos y proporciona un modelo fácil de entender para identificar predictores importantes rápidamente. Sin embargo, después de la exploración inicial con Clasificación CART®, considere la Clasificación TreeNet® como un paso de seguimiento necesario. La Clasificación TreeNet® proporciona un modelo de alto rendimiento y más complejo que puede consistir en varios cientos de árboles pequeños. Cada árbol contribuye con una pequeña cantidad al modelo general. En función de los resultados de Clasificación TreeNet®, puede obtener información sobre la relación entre una respuesta categórica y los predictores importantes entre muchos predictores candidatos, y predecir las probabilidades de la clase de respuesta para nuevas observaciones con gran exactitud.

El análisis Clasificación TreeNet® proporciona gráficas de dependencia parcial para uno y dos predictores. Estas gráficas le ayudan a evaluar cómo los cambios de las variables predictoras clave afectan a los valores de respuesta. Por lo tanto, esta información puede ser útil para controlar la configuración que permita un resultado óptimo de producción.

Para una introducción más completa a la metodología CART®, véase Breiman, Friedman, Olshen y Stone (1984)1 y 2.

Ajustar modelo

Utilice la Ajustar modelo para construir un modelo de árboles de clasificación con potenciación del gradiente individual para una respuesta categórica con muchas variables predictoras continuas y categóricas. Los resultados son para el modelo del proceso de aprendizaje con la log-verosimilitud máxima, el área máxima bajo la curva ROC o la tasa mínima de clasificación errónea.

Descubrir predictores clave

Utilice Descubrir predictores clave para eliminar los predictores menos importantes del conjunto de predictores que ingrese para el modelo. La eliminación de los predictores menos importantes ayuda a aclarar los efectos de los predictores más importantes y mejora la precisión de la predicción. El algoritmo elimina los predictores menos importantes de forma escalonada, muestra los resultados que le permiten comparar modelos con diferentes números de predictores y produce resultados para el conjunto de predictores con el mejor valor del criterio de precisión.

Por ejemplo, un investigador de mercado utiliza Descubrir predictores clave para identificar automáticamente una docena de predictores de un conjunto de 500 predictores que modelan eficazmente qué clientes tienen tasas de respuesta más altas a iniciativas específicas.

Descubrir predictores clave también puede eliminar los predictores más importantes para evaluar cuantitativamente el efecto de cada predictor importante en la precisión de predicción de un modelo.

Dónde encontrar este análisis

Para realizar un Ajustar modelo, elija Módulo de análisis predictivo > Clasificación TreeNet® > Ajustar modelo.

Para realizar un Descubrir predictores clave, elija Módulo de análisis predictivo > Clasificación TreeNet® > Descubrir predictores clave.

Cuándo utilizar un análisis alterno

Si desea probar un modelo de regresión paramétrica con una variable de respuesta binaria, utilice Ajustar modelo logístico binario.

Para comparar el rendimiento de un modelo de clasificación Random Forests®, utilice Clasificación Random Forests®

1 Breiman, Friedman, Olshen y Stone. (1984). Classification and Regression Trees. Boca Raton, Florida: Chapman y Hall/CRC.
2 H. Zhang y B.H. Singer. (2010). Recursive Partitioning and Applications. New York, New York: Springer