Tableau récapitulatif du modèle pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Classification TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Trouvez des définitions et des pistes d’interprétation pour le tableau récapitulatif du modèle.
Remarque

Minitab affiche les résultats des ensembles de données d'apprentissage et de test. Les résultats de test indiquent si le modèle peut prédire de manière adaptée les valeurs de réponse pour les nouvelles observations, ou récapituler correctement les relations entre les variables de réponse et de prédiction. Utilisez les résultats d'apprentissage pour évaluer le surajustement du modèle.

Nombre total de prédicteurs

Nombre total de prédicteurs disponibles pour le modèle TreeNet®. Le total correspond à la somme des prédicteurs continus et de catégorie que vous spécifiez.

Prédicteurs importants

Nombre de prédicteurs importants dans le modèle TreeNet®. Les prédicteurs importants ont des scores d'importance supérieurs à 0. Vous pouvez utiliser la courbe d'importance relative des variables pour afficher l'ordre d'importance relative des variables. Par exemple, supposons que 10 des 20 prédicteurs soient importants dans le modèle, la courbe d'importance relative des variables affiche les variables dans l'ordre d'importance.

Nombre d'arbres cultivés

Par défaut, Minitab cultive 300 petits arbres CART® pour produire le modèle TreeNet®. Bien que cette valeur fonctionne bien pour l'exploration des données, envisagez de cultiver plus d'arbres pour produire un modèle final. Pour modifier le nombre d'arbres cultivés, accédez à la sous-boîte de dialogue Options.

Nombre optimal d'arbres

Le nombre optimal d'arbres correspond à la valeur la plus basse de la moyenne du log de vraisemblance ou du taux de mauvais classement, ou à la valeur la plus élevée de l'aire sous la courbe ROC.

Lorsque le nombre optimal d'arbres est proche du nombre maximal d'arbres que le modèle cultive, envisagez d'effectuer une analyse avec plus d'arbres. Ainsi, si vous cultivez 300 arbres et le nombre optimal est de 298, créez à nouveau le modèle avec plus d'arbres. Si le nombre optimal continue d'être proche du nombre maximal, continuez d'augmenter le nombre d'arbres.

Moyenne du log de vraisemblance

Minitab calcule la moyenne de la fonction de log de vraisemblance négatif lorsque la réponse est binaire. Comparez les valeurs moyennes de log de vraisemblance pour le test de différents modèles afin de déterminer celui qui convient le mieux. La valeur moyenne de log de vraisemblance la plus faible indique un meilleur ajustement.

Aire sous la courbe ROC

La courbe ROC représente le taux de vrais positifs (TPR), également appelé puissance, sur l'axe Y. La courbe ROC représente le taux de faux positifs (FPR), également appelé erreur de type 1, sur l'axe X. L'aire sous une courbe ROC indique si le modèle est un bon classificateur.

Pour les arbres de classification, l'aire sous les valeurs de la courbe ROC varie généralement de 0,5 à 1. Plus les valeurs sont élevées, meilleure est la classification du modèle. Lorsque le modèle peut parfaitement séparer les classes, l'aire sous la courbe est de 1. Lorsque le modèle ne peut pas séparer les classes plus efficacement qu'une affectation aléatoire, l'aire sous la courbe est de 0,5.

Lift

Minitab affiche le lift lorsque la réponse est binaire. Le lift correspond au lift cumulé pour les 10 % des données ayant les meilleures chances de classification correcte.

Le lift représente le rapport de la réponse cible divisée par la réponse moyenne. Lorsque le lift est supérieur à 1, un segment des données a une réponse supérieure à la prédiction.

Taux de mauvais classement

Le taux optimal de mauvais classement se produit sur l'arbre qui présente une zone située sous la courbe ROC optimale. Le taux de mauvais classement indique la fréquence à laquelle le modèle classe correctement les événements et les non-événements.

Des valeurs plus petites indiquent de meilleures performances.