Tout arbre de régression est une collection de divisions. Chaque division apporte une amélioration à l'arbre. Chaque division comprend également des divisions de substitution qui apportent également une amélioration à l'arbre. L'importance d'une variable est donnée par toutes ses améliorations lorsque l'arbre l'utilise pour diviser un nœud, que ce soit directement ou comme substitut lorsqu'une valeur est manquante pour une autre variable. La formule suivante donne l'amélioration à un seul nœud :
Les valeurs de I(t), de pGauche et de pDroite dépendent du critère de partition des nœuds. Pour plus d'informations, accédez à Méthodes de partition des nœuds dans Régression CART®.
Le R2 est également appelé coefficient de détermination.
Terme | Description |
---|---|
yi | i e valeur de réponse observée |
réponse moyenne | |
i e réponse ajustée | |
N | nombre d'enregistrements |