Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.
Un equipo de investigadores recopila datos de la venta de propiedades residenciales individuales en Ames, Iowa. Los investigadores quieren identificar las variables que afectan el precio de venta. Las variables incluyen el tamaño del lote y varias características de la propiedad residencial.
Después de la exploración inicial para Regresión CART® identificar los predictores importantes, el equipo utiliza Regresión Random Forests® para crear un modelo más intensivo a partir del mismo conjunto de datos. El equipo compara la tabla de resumen del modelo y la gráfica R2 de los resultados para evaluar qué modelo proporciona un mejor resultado de predicción.
Estos datos se adaptaron en base a un conjunto de datos públicos que contenían información sobre los datos de vivienda de Ames. Datos originales de DeCock, Universidad Estatal de Truman.
Validación del modelo | Validación con datos de "out-of-bag" |
---|---|
Número de muestras de bootstrap | 300 |
Tamaño de la muestra | Igual que el tamaño de los datos de entrenamiento de 2930 |
Número de predictores seleccionados para la división de nodos | 30% del número total de predictores = 23 |
Tamaño mínimo del nodo interno | 5 |
Filas utilizadas | 2930 |
Media | Desv.Est. | Mínimo | Q1 | Mediana | Q3 | Máximo |
---|---|---|---|---|---|---|
180796 | 79886.7 | 12789 | 129500 | 160000 | 213500 | 755000 |
Total de predictores | 77 |
---|---|
Predictores importantes | 68 |
Estadísticas | Out-of-Bag |
---|---|
R-cuadrado | 90.90% |
Raíz de los cuadrados medios del error (RMSE) | 24097.3281 |
Cuadrado medio del error (MSE) | 5.80681E+08 |
Desviación absoluta media (MAD) | 14746.8323 |
Media del error porcentual absoluto (MAPE) | 0.0895 |
La tabla resumen del modelo muestra que los valores de R2 han mejorado ligeramente con respecto a los valores de R2 del análisis CART® correspondiente.