Valeurs ajustées et statistiques d'erreur pour le meilleur et le pire nœud terminal pour CART® Regression

Utilisez les valeurs ajustées et les statistiques d'erreur pour caractériser les nœuds présentant un intérêt particulier en raison de leurs performances.

Interprétation

Chaque ligne du tableau affiche les valeurs d'ajustement et les statistiques d'erreur pour un nœud. Les meilleurs nœuds sont classés de la plus petite quantité d'erreur à la plus grande. Les pires nœuds sont classés de l'erreur la plus grande à la plus petite.

Lorsque vous utilisez un ensemble de données de test, Minitab calcule des statistiques distinctes pour les données d'apprentissage et de test. Vous pouvez comparer les statistiques pour examiner les performances relatives de l'arbre avec les données d'apprentissage et avec de nouvelles données. Les statistiques de test sont généralement une meilleure mesure de la qualité de l'arbre avec de nouvelles données.

Ajustement
La valeur ajustée est la valeur de réponse moyenne des cas dans le nœud. La valeur ajustée est la valeur prévue pour les nouvelles données qui se trouvent dans le même nœud. Les nœuds terminaux présentant des valeurs ajustées différentes de celles des autres nœuds terminaux peuvent être d'un intérêt particulier, car les valeurs ajustées des cas appartenant à ces nœuds terminaux seront différentes.
Dénombrement
Le dénombrement est le nombre de cas dans le nœud. Si l'analyse inclut des pondérations, le dénombrement devient le dénombrement pondéré. Les nœuds terminaux avec de nombreux cas peuvent être d'un intérêt particulier car ces nœuds représentent généralement des cas plus fréquents.
EcTyp
L'écart type est l'écart type des valeurs de réponse dans le nœud. Les nœuds terminaux avec des écarts types plus petits peuvent être d'un intérêt particulier car les prévisions de ces nœuds sont plus précises que pour les nœuds terminaux avec des écarts types plus grands.
MSE
L'erreur quadratique moyenne (MSE) mesure l'exactitude du nœud. Les valeurs aberrantes ont un plus grand effet sur la MSE que sur le MAD et le MAPE.
MAD

L'écart absolu moyen (MAD) exprime l'exactitude dans les mêmes unités que les données, ce qui permet de conceptualiser la quantité d'erreur. Les valeurs aberrantes ont moins d'effet sur le MAD que sur la MSE.

MAPE
Le pourcentage d'erreur absolue moyen (MAPE) exprime l'exactitude en pourcentage d'erreur. Etant donné que le MAPE est un pourcentage, il peut être plus facile à comprendre que les autres statistiques de mesure de l'exactitude. Par exemple, si le MAPE est de 5, en moyenne, la valeur ajustée présente 5 % d'inexactitude. Les valeurs aberrantes ont moins d'effet sur le MAPE que sur la MSE.

Cependant, parfois, vous pouvez voir une valeur de MAPE très grande, même si le nœud semble bien ajuster les données. Examinez le diagramme de la valeur de réponse ajustée par rapport à la valeur de réponse réelle pour voir si les valeurs de données sont proches de 0. Etant donné que le MAPE divise l'erreur absolue par les données réelles, les valeurs proches de 0 peuvent grandement augmenter le MAPE.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique