Diagramme de coût de mauvais classement par rapport au nombre de nœuds terminaux pour Classification CART®

L’arbre le plus exact est l’arbre dont le coût de mauvais classement est le plus bas. Cet arbre est également appelé arbre optimal.

Parfois, les arbres plus simples avec des coûts de mauvais classement légèrement plus élevés fonctionnent tout aussi bien. Généralement, un arbre avec moins de nœuds terminaux donne une idée plus claire de la façon dont chaque variable de prédiction affecte les valeurs de réponse. Un arbre plus petit facilite également l’identification de quelques groupes cibles pour effectuer d’autres études. Si la différence dans l’exactitude de prédiction pour un arbre plus petit est négligeable, vous pouvez utiliser le plus petit arbre pour évaluer les relations entre les variables de réponse et de prédiction.

Cliquez sur Sélectionner un arbre alternatif pour ouvrir une vue interactive du diagramme qui comprend un tableau de statistiques récapitulatives du modèle. Utilisez le diagramme pour étudier les petits arbres ayant des performances similaires.

Interprétation

Dans cet exemple, l’arbre avec quatre nœuds terminaux possède l’étiquette "Optimal" parce que le critère pour la création de l’arbre est le plus petit arbre dont le coût de mauvais classement se situe à moins d’une erreur type du coût de mauvais classement minimal. L’arbre avec quatre nœuds terminaux a un coût de mauvais classement d’environ 0,415. L’arbre avec six nœuds terminaux a un coût de mauvais classement légèrement inférieur d’environ 0,397. L’arbre avec sept nœuds terminaux a un coût minimal de mauvais classement d’environ 0,391. L’arbre initial avec quatre nœuds terminaux conserve l’étiquette "Optimal" lorsque vous utilisez Sélectionner un arbre alternatif pour créer des résultats pour un arbre différent.