Tableau de méthode pour Régression MARS®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Trouvez des définitions et des pistes d'interprétation pour le tableau de méthode.

Critère de sélection du meilleur modèle

Critère utilisé Régression MARS® pour créer le modèle. Régression MARS® utilise le R-carré maximum (par défaut) ou l’écart absolu moyen le plus faible pour sélectionner le meilleur modèle. Le critère de l’écart absolu moyen tente de diminuer l’influence des points présentant les pires ajustements par rapport au critère R-carré.

Validation de modèle

Régression MARS® Utilise la méthode de validation croisée ou un jeu de tests distinct pour valider le modèle. Avec la validation croisée, vous pouvez spécifier les lignes pour chaque ensemble, ou autoriser une sélection aléatoire. Avec un ensemble de test distinct, vous pouvez spécifier les lignes pour les ensembles d’apprentissage et de test ou autoriser une sélection aléatoire.

Nombre maximal de fonctions de base

L’analyse ajuste ce nombre de fonctions de base avant d’utiliser l’élimination inverse des fonctions de base pour sélectionner le meilleur modèle. La valeur par défaut est 30. Des valeurs plus élevées indiquent que l’analyse a effectué une recherche plus approfondie du modèle optimal.

Nombre minimal d'observations entre les noeuds

Un nœud est un point de données où les fonctions de base changent. Par défaut, l’analyse utilise la taille de l’échantillon et la complexité du modèle pour sélectionner automatiquement un nombre minimum. Sinon, le tableau affiche le nombre spécifique pour l’analyse. Une valeur de 1 indique que des points de données consécutifs peuvent être des points où la fonction de base change. La valeur de 1 permet les changements les plus rapides dans les prédictions du modèle. Tenez compte de différentes valeurs pour voir l’effet sur l’ajustement du modèle. Par exemple, pour certaines données, des valeurs plus élevées créent des modèles plus lisses qui sont moins susceptibles de surajuster les données d’apprentissage. Ces modèles plus lisses sont parfois moins précis sur certaines plages de données.

Lignes utilisées

Nombre d'observations de réponse incluses dans l'analyse qui ajuste et évalue le modèle.

Lignes non utilisées

Nombre d'observations de réponse manquantes. Cela inclut également les valeurs manquantes ou les zéros dans la colonne de pondération.