Este comando está disponible con el Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.
Un equipo de investigadores recopila datos de la venta de propiedades residenciales individuales en Ames, Iowa. Los investigadores quieren identificar las variables que afectan el precio de venta. Las variables incluyen el tamaño del lote y varias características de la propiedad residencial. Los investigadores quieren evaluar qué tan bien el mejor modelo MARS® se ajusta a los datos.
Por defecto, Regresión MARS® se ajusta a un modelo aditivo para que todas las funciones de base en la ecuación de regresión usen 1 predictor. El primer predictor de la lista es BF2. BF2 utiliza el predictor Zona de estar. Debido a que el predictor está en 1 función base, el predictor tiene 2 pendientes diferentes en el modelo. La función máx.(0, 3078 - Zona de estar) define que la pendiente es distinta de cero cuando la superficie habitable es inferior a 3.078.
En estos resultados, la lista de funciones básicas tiene 15 funciones básicas, pero el número óptimo de funciones básicas es 13. La ecuación de regresión contiene 13 funciones básicas. La lista de funciones base contiene BF7 y BF17, que son las funciones base que identifican los valores que faltan. Estas funciones de base no son importantes por sí solas porque no redujeron el MSE tanto como otras funciones básicas en la búsqueda. Estas 2 funciones básicas están en la lista para mostrar el cálculo completo de BF10 y BF 19, que son importantes.
Total de predictores | 77 |
---|---|
Predictores importantes | 10 |
Número máximo de funciones base | 30 |
Número óptimo de funciones base | 13 |
Estadísticas | Entrenamiento | Prueba |
---|---|---|
R-cuadrado | 89.61% | 87.61% |
Raíz de los cuadrados medios del error (RMSE) | 25836.5197 | 27855.6550 |
Cuadrado medio del error (MSE) | 667525749.7185 | 775937512.8264 |
Desviación absoluta media (MAD) | 17506.0038 | 17783.5549 |
La tabla de resumen del modelo incluye medidas del rendimiento del modelo. Puede utilizar estos valores para comparar modelos. Para estos resultados, la prueba R-cuadrado es de aproximadamente 88%.