Revisión general de Clasificación Random Forests®

Nota

Este comando está disponible con el Módulo de análisis predictivo. Haga doble clic aquí para obtener información sobre cómo activar el módulo.

Utilice Clasificación Random Forests® para crear un modelo de predicción de alto rendimiento para una respuesta categórica con muchas variables predictoras continuas y categóricas. La Clasificación Random Forests® combina información de muchos árboles CART® para ofrecer un avance sustancial en la tecnología de minería de datos.

Clasificación Random Forests® proporciona información para una amplia gama de aplicaciones, incluido el control de calidad de fabricación, el descubrimiento de fármacos, la detección de fraudes, la puntuación de crédito y la predicción de abandonos. Utilice los resultados para identificar variables importantes, para identificar grupos en los datos con características deseables y para pronosticar valores de respuesta para nuevas observaciones. Por ejemplo, un investigador de mercado puede utilizar Clasificación Random Forests® para identificar a los clientes que tienen tasas de respuesta más altas a iniciativas específicas y pronosticar esas tasas de respuesta.

Clasificación CART® es una buena herramienta de análisis exploratorio de datos y proporciona un modelo fácil de entender para identificar predictores importantes rápidamente. Sin embargo, después de la exploración inicial con Clasificación CART®, considere Clasificación TreeNet® o Clasificación Random Forests® como un paso de seguimiento necesario.

La salida de Clasificación Random Forests® incluye gráficas de importancia relativa de las variables, curvas ROC y gráficas de elevación y ganancia. Estas gráficas le ayudan a evaluar si las variables del modelo predicen las clases de respuesta con alta exactitud y le ayudan a identificar los predictores más importantes para la exactitud de la predicción. Esta información es útil cuando se desea controlar la configuración que permite un resultado óptimo de producción.

El método fue desarrollado por Leo Breiman y Adele Cutler de la Universidad de California, Berkeley.

Dónde encontrar este análisis

Para realizar un Clasificación Random Forests®, elija Módulo de análisis predictivo > Clasificación Random Forests®.

Cuándo utilizar un análisis alterno

Si desea probar un modelo de regresión paramétrica con una variable de respuesta categórica, utilice Ajustar modelo logístico binario.