Diagramme de l'aire sous la courbe ROC par rapport au nombre d'arbres pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Classification TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Le diagramme de l'aire sous la courbe ROC par rapport au nombre d'arbres indique la zone située sous la courbe ROC sur l'axe Y et le nombre d'arbres sur l'axe X. L'aire sous une courbe ROC indique si le modèle est un bon classificateur. Utilisez les résultats de test pour évaluer les performances du modèle afin de prédire de nouvelles observations. Comparez les résultats d'apprentissage et de test pour voir s'il existe des problèmes de surajustement avec le modèle de l'ensemble de données d'apprentissage.

Lorsque la valeur de vraisemblance maximale détermine le nombre d'arbres pour le modèle optimal, Minitab affiche le diagramme de la moyenne de log de vraisemblance par rapport au nombre d'arbres. Lorsque le taux minimal de mauvais classement détermine le nombre d'arbres pour le modèle optimal, Minitab affiche le diagramme de taux de mauvais classement par rapport au nombre d'arbres.

Interprétation

Pour les arbres de classification, l'aire sous les valeurs de la courbe ROC varie généralement de 0,5 à 1. Plus les valeurs sont élevées, meilleure est la classification du modèle. Lorsque le modèle peut parfaitement séparer les classes, l'aire sous la courbe est de 1. Lorsque le modèle ne peut pas séparer les classes plus efficacement qu'une affectation aléatoire, l'aire sous la courbe est de 0,5.

La ligne de référence indique l'aire sous la courbe ROC optimale pour les données de test et le nombre d'arbres dans le modèle.

Idéalement, la courbe de test augmente à mesure que le nombre d'arbres augmente, puis atteint une valeur maximale avant de s'aplanir ou de diminuer dans certains cas. Si la valeur maximale de la courbe de test n'est pas idéale, essayez d'ajuster les taux d'apprentissage et les fractions de sous-échantillon pour comparer les valeurs.