Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.
Nombre total de prédicteurs disponibles pour le modèle Random Forests®. Le total correspond à la somme des prédicteurs continus et de catégorie que vous spécifiez.
Nombre de prédicteurs importants dans le modèle Random Forests®. Les prédicteurs importants ont des scores d'importance supérieurs à 0,0. Vous pouvez utiliser la courbe d'importance relative des variables pour afficher l'ordre d'importance relative des variables. Par exemple, supposons que 10 des 20 prédicteurs soient importants dans le modèle, la courbe d'importance relative des variables affiche les variables dans l'ordre d'importance.
Le R2 est le pourcentage de variation dans la réponse que le modèle explique.
Utilisez le R2 pour déterminer la qualité d'ajustement offert par le modèle. Plus la valeur de R2 est élevée, plus l'ajustement offert par le modèle est bon. Le R2 se situe toujours entre 0 % et 100 %.
Étant donné que Random Forests® utilise des données out-of-bag pour calculer R2, mais pas pour s’adapter au modèle, le surajustement du modèle n’est pas un problème.
La racine de l'erreur quadratique moyenne (RMSE) mesure l'exactitude du modèle. Les valeurs aberrantes ont un plus grand effet sur la RMSE que sur le MAD et le MAPE.
Utilisez cette statistique pour comparer les valeurs ajustées de différents modèles. Des valeurs plus petites indiquent un meilleur ajustement.
L'erreur quadratique moyenne (MSE) mesure l'exactitude du modèle. Les valeurs aberrantes ont un plus grand effet sur la MSE que sur le MAD et le MAPE.
Utilisez cette statistique pour comparer les valeurs ajustées de différents modèles. Des valeurs plus petites indiquent un meilleur ajustement.
L'écart absolu moyen (MAD) exprime l'exactitude dans les mêmes unités que les données, ce qui permet de conceptualiser la quantité d'erreurs. Les valeurs aberrantes ont moins d'effet sur le MAD que sur le R2, la RMSE et la MSE.
Utilisez cette statistique pour comparer les valeurs ajustées de différents modèles. Des valeurs plus petites indiquent un meilleur ajustement.
Le pourcentage d'erreur absolue moyen (MAPE) exprime la taille de l'erreur par rapport à la taille de la valeur de réponse. Ainsi, l'erreur de même taille aura une valeur MAPE plus grande pour une valeur inférieure de la variable de réponse que pour une valeur plus grande. Étant donné que le MAPE est un pourcentage, il peut être plus facile à comprendre que les autres statistiques de mesure de l'exactitude. Par exemple, si le MAPE est de 0,05 en moyenne, le rapport moyen entre l'erreur ajustée et la valeur réelle est de 5 % dans tous les cas. Les valeurs aberrantes ont moins d'effet sur le MAPE que sur le R2, la RMSE et la MSE.
Cependant, parfois, vous pouvez voir une valeur de MAPE très grande, même si le modèle semble bien ajuster les données. Examinez le diagramme de la valeur de réponse ajustée par rapport à la valeur de réponse réelle pour voir si les valeurs de données sont proches de 0. Étant donné que le MAPE divise l'erreur absolue par les données réelles, les valeurs proches de 0 peuvent grandement augmenter le MAPE.
Utilisez cette statistique pour comparer les valeurs ajustées de différents modèles. Des valeurs plus petites indiquent un meilleur ajustement.