Total de predictores | 77 |
---|---|
Predictores importantes | 10 |
Número máximo de funciones base | 30 |
Número óptimo de funciones base | 13 |
Estadísticas | Entrenamiento | Prueba |
---|---|---|
R-cuadrado | 89.61% | 87.61% |
Raíz de los cuadrados medios del error (RMSE) | 25836.5197 | 27855.6550 |
Cuadrado medio del error (MSE) | 667525749.7185 | 775937512.8264 |
Desviación absoluta media (MAD) | 17506.0038 | 17783.5549 |
En estos resultados, la prueba R-cuadrado es de aproximadamente 88%. El error cuadrático medio de la raíz de prueba es de aproximadamente 27,856. El error cuadrático medio de la prueba es de aproximadamente 775,937,513. La desviación absoluta media de la prueba es de aproximadamente 17,784.
Utilice el gráfico de importancia relativa de variables para ver qué predictores son las variables más importantes para el modelo.
Las variables importantes están en al menos 1 función base en el modelo. La variable con la puntuación de mejora más alta se establece como la variable más importante y las otras variables se clasifican en consecuencia. La Importancia relativa de las variables estandariza los valores de importancia para facilitar la interpretación. La importancia relativa se define como la mejora porcentual con respecto al predictor más importante.
Los valores de importancia relativa de las variables oscilan entre el 0% y el 100%. La variable más importante siempre tiene una importancia relativa del 100%. Si una variable no está en una función base, esa variable no es importante.
Aunque estos resultados incluyen 10 variables con importancia positiva, las clasificaciones relativas proporcionan información sobre cuántas variables controlar o supervisar para una determinada aplicación. Las caídas pronunciadas en los valores de importancia relativa de una variable a la siguiente variable pueden guiar las decisiones sobre qué variables controlar o supervisar. Por ejemplo, en estos datos, las 2 variables más importantes tienen valores de importancia que están relativamente cerca entre sí antes de una caída de más del 20% en importancia relativa a la siguiente variable. Del mismo modo, 2 variables tienen valores de importancia similares superiores al 60%. Puede quitar variables de diferentes grupos y rehacer el análisis para evaluar cómo afectan las variables de varios grupos a los valores de exactitud de predicción de la tabla de resumen del modelo.
Utilice las gráficas de dependencia parcial, las funciones base y los coeficientes de la ecuación de regresión para determinar el efecto de los predictores. Los efectos de los predictores explican la relación entre los predictores y la respuesta. Considere todas las funciones básicas de un predictor para comprender el efecto del predictor en la variable de respuesta.
Además, considere el uso de los predictores importantes y las formas de sus relaciones cuando construya otros modelos. Por ejemplo, si el modelo de regresión MARS® incluye interacciones, considere si incluir esas interacciones en un modelo de regresión de mínimos cuadrados para comparar el rendimiento de los dos tipos de modelos. En las aplicaciones en las que se controlan los predictores, los efectos proporcionan una forma natural de optimizar la configuración para lograr un objetivo para la variable de respuesta.
En un modelo aditivo, los gráficos de dependencia parcial de un predictor muestran cómo los predictores continuos importantes afectan la respuesta prevista. La gráfica de dependencia parcial para un predictor indica cómo se espera que cambie la respuesta con los cambios en los niveles del predictor. Para MARS®, los valores de la gráfica provienen de las funciones base para el predictor en el eje x. La contribución en el eje y está estandarizada para que el valor mínimo en la parcela sea 0.
Este gráfico ilustra que aumenta a medida que Precio de venta aumenta Zona de estar de los pies cuadrados mínimos en el conjunto de datos a aproximadamente 3,000 pies cuadrados. Después de Zona de estar alcanzar los 3,000 pies cuadrados, la contribución se vuelve plana en Precio de venta aproximadamente $ 152,000.
En estos resultados, BF2 tiene un coeficiente negativo en la ecuación de regresión. El coeficiente para la función base es −57.6167. La disposición de la función base es máx.(0, c − X). En esta disposición, el valor de la función base disminuye cuando aumenta el predictor. La combinación de esta disposición y el coeficiente negativo crea una relación positiva entre la variable predictora y la variable de respuesta. La pendiente de es 57.6167 de Zona de estar 438 a 3,078.
Para obtener más ejemplos de funciones de base comunes, vaya a Ecuación de regresión para MARS®.