Validation de modèle

Régression Random Forests® utilise la validation out-of-bag pour chaque analyse. Si vous sélectionnez la validation avec un fichier de test en plus de la validation out-of-bag, le tableau affiche la colonne qui identifie le fichier de test ou le pourcentage des données dans les fichiers de test et d'apprentissage.

Nombre d'échantillons bootstrap

Le nombre d’échantillons bootstrap indique le nombre d’arbres dans l'analyse. Lorsque vous utilisez la seule validation out-of-bag, la taille de l’échantillon est la même que le nombre de lignes dans l’analyse. Lorsque vous utilisez la validation avec un fichier de test, la taille de l’échantillon par défaut est la même que la taille des données d'apprentissage. Si vous choisissez d’utiliser une taille d'échantillon plus petite que la taille des données d'apprentissage, le tableau affiche cette taille.

Nombre de prédicteurs sélectionnés pour la partition des nœuds

Cette ligne indique si la partition des nœuds tient compte de tous les prédicteurs à chaque nœud ou d'un sous-ensemble aléatoire des prédicteurs. Si la partition des nœuds utilise un sous-ensemble aléatoire, cette ligne indique le choix du nombre de prédicteurs à prendre en compte.

Si vous utilisez tous les prédicteurs au départ, envisagez d'utiliser un sous-ensemble de prédicteurs dans les modèles ultérieurs pour comparer les performances des modèles.

Taille minimale du nœud interne

La taille minimale du nœud interne est le nombre minimal de cas que peut avoir un nœud tout en pouvant se séparer en d'autres nœuds. Si les performances du modèle sont insuffisantes, envisagez d'augmenter cette valeur pour observer l'effet sur les performances.

Pénalité de valeur manquante

Par défaut, l’analyse n’a pas de pénalité de valeur manquante et cette ligne n’est pas présente. La pénalité de valeur manquante pénalise une variable de prédiction en fonction de la proportion de valeurs manquantes. Une variable avec une pénalité élevée est moins susceptible de devenir le séparateur d'un nœud.

Pénalité de catégorie de niveau élevé

Par défaut, l’analyse n’a pas de pénalité de catégorie de niveau élevé et cette ligne n’est pas présente. La pénalité de catégorie de niveau élevé pénalise une variable en fonction du nombre de niveaux de catégorie par rapport à la taille du nœud pour chaque nœud. Donc, un concurrent à nombreux niveaux dans un nœud est moins susceptible de devenir le séparateur pour ce nœud.

Lignes utilisées

Nombre d'observations de réponse incluses dans l'analyse qui ajuste et évalue le modèle.

Lignes non utilisées

Nombre d'observations de réponse manquantes.