Méthodes et formules pour les informations de réponse pour Régression Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Si vous ajoutez la validation avec un ensemble de test à la validation out-of-bag, le tableau comprend des statistiques distinctes pour l'ensemble d'apprentissage et l'ensemble de test.

N

Le tableau inclut cette statistique lorsque vous ajoutez la validation avec un ensemble de test. Les nombres correspondent aux valeurs de réponse présentes dans les ensembles de test et d'apprentissage.

% de N

Le tableau inclut cette statistique lorsque vous ajoutez la validation avec un ensemble de test. Les nombres sont le pourcentage d'observations qui se trouvent dans le fichier de données d'apprentissage et dans le fichier de données de test.

Moyenne

Une mesure couramment utilisée du centre d'un lot de nombres. Il s'agit de la moyenne. Il s'agit de la somme de toutes les observations divisée par le nombre d'observations (présentes).

EcTyp

Si le fichier de données contient avec la moyenne , l'écart type de l'échantillon est :
TermeDescription
observation
moyenne des observations
Nnombre d'observations présentes

Minimum

Plus petite valeur du fichier de données.

Q1

25 % de vos observations d'échantillon sont inférieures ou égales à la valeur du 1er quartile. Donc, le 1er quartile est également le 25e percentile.

Médiane

La médiane de l'échantillon se trouve au milieu des données : au moins la moitié des observations lui est inférieure ou égale, et au moins la moitié lui est supérieure ou égale.

Supposons qu'un fichier de données contient N valeurs. Pour calculer la médiane, vous devez d'abord classer vos valeurs de données de la plus petite à la plus grande. Si N est impair, la médiane de l'échantillon est la valeur centrale. Si N est pair, la médiane de l'échantillon est la moyenne des deux valeurs centrales.

Q3

75 % de vos observations d'échantillon sont inférieures ou égales à la valeur du troisième quartile. Donc, le troisième quartile est également le 75e percentile.

Maximum

Plus grande valeur du fichier de données de données.