Surface sous la courbe ROC vs nombre d’arbres à tracer pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Classification TreeNet®

Remarque

Cette commande est disponible avec la commande Module d'analyse prédictive. Cliquez ici pour plus d’informations sur la façon d’activer le module.

Le diagramme de la zone située sous la courbe ROC par rapport au nombre d'arbres indique la zone située sous la courbe ROC sur l'axe des Y et le nombre d'arbres sur l'axe des X. L'aire sous une courbe ROC indique si le modèle est un bon classificateur. Lorsque l’analyse utilise une méthode de validation, le graphique inclut une ligne pour les résultats de validation. Utilisez les résultats de validation pour évaluer la performance du modèle afin de prédire de nouvelles observations. Comparez les résultats d'apprentissage et de validation pour voir s'il existe des problèmes de surajustement avec le modèle de l'ensemble de données d'apprentissage.

Lorsque la valeur de vraisemblance maximale détermine le nombre d'arbres pour le modèle optimal, Minitab affiche le diagramme de la moyenne de log de vraisemblance par rapport au nombre d'arbres. Lorsque le taux minimal de mauvais classement détermine le nombre d'arbres pour le modèle optimal, Minitab affiche le diagramme de taux de mauvais classement par rapport au nombre d'arbres.

Interprétation

Pour les arbres de classification, la zone située sous les valeurs de la courbe ROC varie généralement de 0,5 à 1. Plus les valeurs sont élevées, meilleure est la classification du modèle. Lorsque le modèle peut parfaitement séparer les classes, la zone située sous la courbe est de 1. Lorsque le modèle ne peut pas séparer les classes plus efficacement qu'une affectation aléatoire, la zone située sous la courbe est de 0,5.

La ligne de référence indique l'aire sous la courbe ROC optimale pour les données de test et le nombre d'arbres dans le modèle.

Idéalement, la courbe des résultats de validation augmente à mesure que le nombre d’arbres augmente, puis atteint un maximum avant de niveler ou de diminuer dans certains cas. Si le maximum pour la courbe des résultats de validation n’est pas idéal, essayez d’ajuster les taux d’apprentissage et les fractions de sous-échantillonnage pour comparer.