Valeurs ajustées et statistiques d'erreur pour les nœuds terminaux dans Régression CART®

Sélectionnez la méthode ou la formule de votre choix.

Les statistiques des nœuds proviennent des données relatives aux nœuds individuels. Lorsque vous utilisez une méthode de validation, l'ajustement pour un nœud est le même dans l'ensemble de données de test que dans l'ensemble de données d'apprentissage. Les autres statistiques utilisent les enregistrements pour le nœud de l'ensemble de données d'apprentissage ou de test.

Ces statistiques apparaissent dans le tableau des meilleurs ou des pires nœuds terminaux. En général, les lignes sont classées en fonction de la taille de l'erreur, déterminée par la MSE ou le MAD. Lorsque les deux valeurs sont inférieures à 1, les valeurs dont la différence est inférieure à 1E-12 sont considérées comme ex aequo. Lorsque l'une des valeurs d'erreur est supérieure à 1, les valeurs dont la différence est inférieure à 1E-12*(valeur plus élevée) sont considérées comme ex aequo. Minitab trie les nombres de même grandeur en fonction de leurs dénombrements pondérés. Si les dénombrements pondérés sont également de la même grandeur, alors Minitab les trie en fonction de l'ID du nœud.

Ajustement

L'ajustement dépend du critère d'amélioration d'un nœud. Lorsque le critère est les moindres carrés, la valeur ajustée est la moyenne :

Lorsque le critère est le moindre écart absolu, la valeur ajustée est la médiane.

EcTyp

MSE

MAD

MAPE

Notation

TermeDescription
valeur ajustée pour le nœud ke
yi valeur de réponse observée i e dans le nœudke
réponse moyenne pour les enregistrements dans le nœud ke
nknombre d’enregistrements dans le nœud ke
nk, tnombre d’enregistrements dans le nœud ke pour les observations dans l’ensemble de données de formation ou dans l’ensemble de données de test
yi, t i e a observé la valeur de réponse dans le nœud ke pour l’ensemble de données de formation ou les données de test Ensemble
réponse moyenne pour les enregistrements du nœud ke dans l’ensemble de données de formation ou les données de test Ensemble