Méthodes et formules pour le pourcentage de statistiques d'erreur pour Régression Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour le pourcentage de statistiques d'erreur, la valeur dépend du pourcentage des résidus les plus grands dans le calcul. Dans les formules suivantes, les calculs supposent que les résidus sont triés par valeur absolue, de sorte que i = 1 représente le résidu de plus grande valeur absolue et i = N le résidu de valeur absolue minimale.

Pour la validation out-of-bag, l’ajustement pour une ligne provient de la moyenne des prédictions lorsque la ligne est dans les données out-of-bag.

Lorsque vous utilisez un ensemble de données de test pour validation, les statistiques de test utilisent des valeurs ajustées seulement pour l'ensemble de données de test.

% MSE

% MAD

% MAPE

Notation

TermeDescription
cnombre de résidus les plus importants pour le pourcentage
yi valeur de réponse observée
réponse moyenne
réponse ajustée
Nnombre de lignes