Méthodes et formules pour le pourcentage de statistiques d'erreur pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Régression TreeNet®

Remarque

Cette commande est disponible avec le module complémentaire d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour le pourcentage de statistiques d'erreur, la valeur dépend du pourcentage des résidus les plus grands dans le calcul. Dans les formules suivantes, les calculs supposent que les résidus sont triés par valeur absolue, de sorte que i = 1 représente le résidu de plus grande valeur absolue et i = N le résidu de valeur absolue minimale.

Lorsque vous utilisez la validation croisée sur K partitions, les statistiques d'apprentissage incluent les valeurs ajustées de l'arbre final pour l'ensemble complet de données. Les statistiques de test utilisent des valeurs ajustées du processus de validation qui peuvent avoir des arbres différents pour chaque partition.

Lorsque vous utilisez un ensemble de données de test pour validation, les statistiques de test utilisent des valeurs ajustées seulement pour l'ensemble de données de test.

% MSE

% MAD

% MAPE

Notation

TermeDescription
cnombre de résidus les plus importants pour le pourcentage
yi valeur de réponse observée
réponse moyenne
réponse ajustée
Nnombre de lignes