Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.
Un equipo de investigadores recopila los datos de la venta de propiedades residenciales individuales en Ames, Iowa. Los investigadores quieren identificar las variables que afectan el precio de venta. Las variables incluyen el tamaño del lote y diversas características de la propiedad residencial.
Después de la exploración inicial con Regresión CART® para identificar los predictores importantes, el equipo utiliza Regresión Random Forests® para crear un modelo más intensivo a partir del mismo conjunto de datos. El equipo compara la tabla de resumen del modelo y la gráfica de R2 provenientes de los resultados para evaluar qué modelo proporciona un mejor resultado de predicción.
Estos datos se adaptaron con base en un conjunto de datos públicos que contiene información acerca de los datos de vivienda de Ames. Datos originales provenientes de DeCock, Truman State University.
La gráfica de R-cuadrada vs. número de árboles muestra toda la curva del número de árboles creados. El valor de R2 incrementa rápidamente a medida que aumenta el número de árboles, después se aplana en aproximadamente 91%.
La tabla resumen del modelo muestra que los valores de R2 han mejorado ligeramente con respecto a los valores de R2 del análisis CART® correspondiente.
La gráfica Importancia relativa de las variables presenta los predictores en el orden de su efecto en la mejora del modelo cuando se realizan divisiones en un predictor sobre la secuencia de árboles. La variable predictora más importante para predecir el precio de venta es calidad. Si la importancia de la variable predictora más importante, calidad, es del 100%, entonces la siguiente variable importante, área de vivienda SF, tiene una contribución del 88.8%. Esto significa que los metros cuadrados de la vivienda son el 88.8% tan importantes como la calidad general de la propiedad. La siguiente variable más importante es vecindario que tiene una contribución del 52.6%.
El diagrama de dispersión del precio de venta ajustado frente al precio de venta real muestra la relación entre los valores ajustados y los valores reales para los datos OOB. Puede pasar el cursor sobre los puntos de la gráfica para ver más fácilmente los valores graficados. En este ejemplo, muchos puntos caen aproximadamente cerca de la línea de referencia de y=x, pero varios puntos pueden necesitar investigación para ver discrepancias entre los valores ajustados y los reales.