Indiquer les paramètres par défaut pour la fonction Classification CART®

Fichier > Options > Analyse prédictive > Classification CART®

Spécifier les méthodes par défaut pour la classification des arbres. Les modifications apportées aux paramètres par défaut s'appliquent jusqu'à une nouvelle modification de ces derniers, même si vous avez quitté Minitab.

Méthode de partition des nœuds
Choisissez la méthode de fractionnement pour générer votre arbre de décision. Vous pouvez comparer les résultats de plusieurs méthodes de fractionnement pour déterminer le meilleur choix pour votre application.
  • : La méthode Gini est la méthode par défaut. La méthode Gini fonctionne bien dans de nombreuses applications. La méthode Gini génère généralement des arbres qui comprennent de petits nœuds avec une forte concentration de la réponse d’intérêt.
  • : La méthode Entropie est proportionnelle au maximum de certaines fonctions de probabilité pour le nœud.
  • : La méthode Twoing n’est disponible qu’avec une réponse multinomiale. La méthode Twoing génère généralement des fractionnements plus équilibrés que les méthodes Gini ou Entropy. Pour une réponse binaire, la méthode Twoing est la même que la méthode Gini.
  • : L’arbre de probabilité tend à être plus grand que l’arbre de Gini. Utilisez la méthode de probabilité lorsque vous êtes intéressé par les performances de quelques nœuds supérieurs.
Critère de sélection d'un arbre optimal
Choisissez entre les critères suivants pour sélectionner l’arbre dans les résultats. Vous pouvez comparer les résultats de différents arbres pour déterminer le meilleur choix pour votre application.
  • : Sélectionnez cette option pour afficher les résultats de l’arbre qui minimise le coût de classification erronée.
  • : Sélectionnez cette option pour afficher les résultats du plus petit arbre avec un coût de classification erroné dans les erreurs standard K du coût minimum de classification erronée. By default, K=1, so the results are for the smallest tree with a misclassification cost within 1 standard error of the tree with the minimum misclassification cost.
Nombre minimal de cas pour diviser un nœud interne
Entrez une valeur pour représenter le nombre minimum de cas qu’un nœud interne à diviser. La valeur par défaut est 10. Avec de plus grandes tailles d’échantillon, vous voudrez peut-être augmenter ce minimum. Par exemple, si un nœud interne a 10 cas ou plus, Minitab va essayer d’effectuer une scission. Si le nœud interne a 9 cas ou moins, Minitab n’essaiera pas d’effectuer une scission.
La limite interne de nœuds doit être au moins deux fois la limite terminale de nœud, mais des ratios plus élevés sont meilleurs. Les limites internes de nœuds d’au moins 3 fois les limites terminales de nœuds permettent un nombre raisonnable de diviseurs.
La valeur par défaut est de 10.
Nombre minimal de cas autorisés pour un nœud terminal
Entrez une valeur pour représenter le nombre minimum de cas qui peuvent être séparés en un nœud terminal. La valeur par défaut est de 3. Avec de plus grandes tailles d’échantillon, vous voudrez peut-être augmenter ce minimum. Par exemple, si une scission crée un nœud avec moins de 3 cas, Minitab n’effectuera pas de fractionnement.
La valeur par défaut est de 3.
Pénalité de valeur manquante
Entrez une valeur de pénalité pour un prédicteur avec des valeurs manquantes. Parce qu’il est plus facile d’être un bon diviseur avec moins de données, les prédicteurs avec des données manquantes ont un avantage sur les prédicteurs sans données manquantes. Utilisez cette option pour pénaliser les prédicteurs avec des données manquantes.
0,0 K 2,0, par exemple :
  • K 0: Ne précise aucune pénalité.
  • K 2 : Spécifie la peine la plus élevée.
Pénalité de catégorie de haut niveau
Entrez une valeur de pénalité pour les prédicteurs catégoriques qui ont de nombreuses valeurs. Parce que les prédicteurs catégoriques avec de nombreux niveaux peuvent déformer un arbre en raison de leur puissance de fractionnement accrue, ils ont un avantage sur les prédicteurs avec moins de niveaux. Utilisez cette option pour pénaliser les prédicteurs avec de nombreux niveaux.
0,0 K à 5,0, par exemple :
  • K 0: Ne précise aucune pénalité.
  • K 5: Spécifie la peine la plus élevée.
Affichage de graphiques et de tables
Taux de la matrice de confusion
Choisissez les tarifs que vous souhaitez afficher sur votre matrice de confusion.
  • Vrai positif : Taux positif réel (TPR) - la probabilité qu’un cas d’événement soit prédit correctement.
  • Faux positif : Faux taux positif (FPR) - la probabilité qu’un cas nonevent soit mal prédit.
  • Faux négatif : Faux taux négatif (FNR) - la probabilité qu’un cas d’événement soit mal prédit.
  • Vrai négatif: Taux négatif réel (TNR) - la probabilité qu’un cas nonevent est prédit correctement.
Courbe de la fonction d'efficacité du récepteur (ROC)
La courbe caractéristique d’exploitation du récepteur (ROC) montre la capacité d’un arbre à distinguer les classes. La courbe du ROC trace le taux positif réel (TPR) par rapport au faux taux positif (FPR).
Courbe des gains
Le tableau cumulatif des gains illustre l’efficacité du modèle dans une partie de la population. Le graphique de gain traces % de classe par rapport à la population en %.
Courbe de lift
Le tableau de levage illustre l’efficacité du modèle prédictif. Le tableau de levage trace l’ascenseur cumulatif par rapport à la population en % et affiche la différence entre les résultats obtenus avec et sans le modèle prédictif. Vous pouvez spécifier ou pour ce graphique.
Type des nœuds terminaux
Choisissez d’afficher les meilleurs nœuds, les pires nœuds, ou les deux pour l’efficacité de la table de classification et les critères pour classer la table des sujets.
  • : Par défaut, Minitab affiche les meilleurs nœuds terminaux. Les meilleurs nœuds ont la probabilité d’événement la plus élevée (binaire) ou la plus haute probabilité de classe (multinomiale) valeurs. Pour une réponse binaire, les meilleurs nœuds ont des probabilités d’événement proches des deux cas finaux de 1 ou 0.
  • : Sélectionnez pour afficher les pires nœuds terminaux. Les pires nœuds ont la probabilité d’événement la plus faible (binaire) ou la plus faible probabilité de classe (multinomiale) valeurs. Pour une réponse binaire, les pires nœuds ont des probabilités d’événements proches de la valeur moyenne de 0,5.
  • : Sélectionnez pour afficher les meilleurs et les pires nœuds terminaux.