Nombre total de prédicteurs | 77 |
---|---|
Prédicteurs importants | 10 |
Nombre maximal de fonctions de base | 30 |
Nombre optimal de fonctions de base | 13 |
Statistiques | Apprentissage | Test |
---|---|---|
R carré | 89,61% | 87,61% |
Racine de l'erreur quadratique moyenne (RMSE) | 25836,5197 | 27855,6550 |
Erreur quadratique moyenne (MSE) | 667525749,7185 | 775937512,8264 |
Ecart absolu moyen (MAD) | 17506,0038 | 17783,5549 |
Dans ces résultats, le test R-carré est d’environ 88%. L’erreur quadratique moyenne de la racine de test est d’environ 27 856. L’erreur quadratique moyenne du test est d’environ 775 937 513. L’écart absolu moyen du test est d’environ 17 784.
Utilisez le graphique d’importance relative des variables pour voir quels prédicteurs sont les variables les plus importantes pour le modèle.
Les variables importantes sont dans au moins 1 fonction de base dans le modèle. La variable avec le score d'amélioration le plus élevé est la variable la plus importante et les autres variables sont classées en conséquence. L'importance relative des variables normalise les valeurs d'importance pour faciliter l'interprétation. L'importance relative se définit comme l'amélioration en pourcentage par rapport au prédicteur le plus important.
Les valeurs d’importance relative des variables varient de 0 % à 100 %. La variable la plus importante a toujours une importance relative de 100%. Si une variable n’est pas dans une fonction de base, cette variable n’est pas importante.
Bien que ces résultats comprennent 10 variables d'importance positive, les classements relatifs fournissent des informations sur le nombre de variables à contrôler ou à surveiller pour une certaine application. Les baisses abruptes des valeurs d'importance relative d'une variable à la suivante peuvent guider les décisions sur les variables à contrôler ou à surveiller. Par exemple, dans ces données, les 2 variables les plus importantes ont des valeurs d’importance relativement proches les unes des autres avant une baisse de plus de 20% de l’importance relative par rapport à la variable suivante. De même, 2 variables ont des valeurs d’importance similaires supérieures à 60%. Vous pouvez supprimer les variables de différents groupes et refaire l'analyse pour évaluer l'impact des variables de différents groupes sur les valeurs d'exactitude de prévision dans le tableau récapitulatif du modèle.
Utilisez les diagrammes de dépendance partielle, les fonctions de base et les coefficients de l’équation de régression pour déterminer l’effet des prédicteurs. Les effets des prédicteurs expliquent la relation entre les prédicteurs et la réponse. Considérez toutes les fonctions de base d’un prédicteur pour comprendre l’effet du prédicteur sur la variable de réponse.
En outre, tenez compte de l’utilisation des prédicteurs importants et des formes de leurs relations lorsque vous construisez d’autres modèles. Par exemple, si le modèle de régression MARS® inclut des interactions, déterminez s’il faut inclure ces interactions dans un modèle de régression des moindres carrés pour comparer les performances des deux types de modèles. Dans les applications où vous contrôlez les prédicteurs, les effets fournissent un moyen naturel d’optimiser les paramètres pour atteindre un objectif pour la variable de réponse.
Dans un modèle additif, des diagrammes de dépendance partielle à un prédicteur montrent comment les prédicteurs continus importants affectent la réponse prédite. Le diagramme de dépendance partielle à un prédicteur indique comment la réponse est censée changer avec les modifications apportées aux niveaux des prédicteurs. Pour Régression MARS®, les valeurs du tracé proviennent des fonctions de base du prédicteur sur l’axe des abscisses. La contribution sur l’axe des y est normalisée de sorte que la valeur minimale sur la parcelle soit 0.
Ce graphique illustre cette augmentation à mesure que prix de vente la zone de vie superficie minimale en pieds carrés dans l’ensemble de données passe d’environ 3 000 pieds carrés. Après zone de vie avoir atteint 3 000 pieds carrés, la contribution à prix de vente devient stable à environ 152 000 $.
Dans ces résultats, BF2 a un coefficient négatif dans l’équation de régression. Le coefficient de la fonction de base est −57,6167. La disposition de la fonction de base est max(0, c - X). Dans cet arrangement, la valeur de la fonction de base diminue lorsque le prédicteur augmente. La combinaison de cet arrangement et du coefficient négatif crée une relation positive entre la variable prédictive et la variable de réponse. La pente de est de 57,6167 de zone de vie 438 à 3 078.
Pour plus d’exemples de fonctions de base courantes, reportez-vous à Équation de régression pour Régression MARS®la section .