Optimisation des hyperparamètres Découvrir le meilleur modèle (réponse continue)

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Trouvez des définitions et des pistes d'interprétation pour le tableau de méthode.

Après la création d’un modèle avec Découvrir le meilleur modèle (réponse continue), vous pouvez cliquer pour explorer Sélectionner un autre arbre d’autres modèles. Si vous sélectionnez un modèle ® Forêts aléatoires, une option consiste à spécifier des hyperparamètres pour s’adapter aux nouveaux modèles. Si vous spécifiez des hyperparamètres, les résultats incluent le tableau Optimisation des hyperparamètres. Le tableau compare les combinaisons d’hyperparamètres. Les résultats qui suivent le tableau Optimisation des hyperparamètres sont pour le modèle avec la meilleure valeur du critère d’optimalité, tel que le maximum R2.

R carré

Le R2 est le pourcentage de variation dans la réponse que le modèle explique.

Interprétation

Utilisez le R2 pour déterminer la qualité d'ajustement offert par le modèle. Plus la valeur de R2 est élevée, plus l'ajustement offert par le modèle est bon. Le R2 se situe toujours entre 0 % et 100 %.

Vous pouvez illustrer graphiquement la signification des différentes valeurs de R2. Le premier diagramme illustre un modèle de régression simple qui explique 85,5 % de la variation de la réponse. Le deuxième diagramme illustre un modèle qui explique 22,6 % de la variation de la réponse. Plus la variation expliquée par le modèle est grande, plus les points de données se rapprochent des valeurs ajustées. Théoriquement, si un modèle peut expliquer 100 % de la variation, les valeurs ajustées sont toujours égales aux valeurs observées et tous les points de données se situent sur la ligne y =x.
Remarque

Étant donné que Random Forests® utilise des données out-of-bag pour calculer R2, mais pas pour s’adapter au modèle, le surajustement du modèle n’est pas un problème.

Écart absolu moyen (MAD)

L'écart absolu moyen (MAD) exprime l'exactitude dans les mêmes unités que les données, ce qui permet de conceptualiser la quantité d'erreurs. Les valeurs aberrantes ont moins d'effet sur le MAD que sur R2.

Interprétation

Utilisez cette statistique pour comparer les valeurs ajustées de différents modèles. Des valeurs plus petites indiquent un meilleur ajustement.

Nombre de prédicteurs pour le fractionnement de nœud

Cette ligne indique le choix du nombre de prédicteurs à prendre en compte.

Taille minimale du nœud interne

La taille minimale du nœud interne est le nombre minimal de cas que peut avoir un nœud tout en pouvant se séparer en d'autres nœuds.

Nombre d'échantillons bootstrap

Le nombre d’échantillons bootstrap indique le nombre d’arbres dans l'analyse.