Boîte à moustaches des valeurs résiduelles pour Régression CART®

Utilisez la boîte à moustaches des valeurs résiduelles pour évaluer l'exactitude globale de l'arbre. Lorsque l’analyse utilise une technique de validation, vous pouvez également comparer les exactitude du arbres pour les données d’entraînement et les résultats de validation.

La boîte à moustaches montre la différence entre les valeurs réelles et ajustées. Les points à plus de 1,5 fois l'étendue interquartile du quartile le plus proche ont des symboles individuels.

Interprétation

Dans l'idéal, les valeurs résiduelles sont toutes proches de 0, par rapport à l'échelle de la variable de réponse. Lorsque vous utilisez une technique de validation, Minitab crée des graphiques séparés pour les données d’entraînement et pour les résultats de validation. Vous pouvez comparer les diagrammes pour examiner les performances relatives de l'arbre avec les données d'apprentissage et avec de nouvelles données. Vous pouvez également chercher différents motifs qui pourraient indiquer une différence à étudier entre les données d’entraînement et les résultats de validation.

Ces boîtes graphiques montrent des résultats similaires pour l’ensemble de données d’entraînement et pour les résultats de validation. Cette similitude suggère que les performances de l'arbre avec de nouvelles données sont proches de celles obtenues avec les données d'apprentissage.

La plage interquartile des boxplots pour les deux ensembles de données va d’environ –2,6 à 2,6. 50 % des données présentent des résidus dans cette fourchette. Les valeurs résiduelles restantes sont plus grandes. Etant donné que l'étendue interquartile est d'environ 5, les valeurs résiduelles qui sont en dehors de la plage approximative allant de -10,5 à 10,5 ont des symboles individuels. Les valeurs résiduelles les plus grandes sont proches de 20 dans les directions positive et négative. Ces grandes valeurs résiduelles peuvent indiquer que l'arbre n'ajuste pas toutes les données correctement.