Choisissez la méthode de fractionnement pour générer votre arbre de décision. Vous pouvez comparer les résultats de plusieurs méthodes de fractionnement afin de déterminer le meilleur choix pour votre application.
Gini: La méthode Gini est la méthode par défaut. La méthode Gini fonctionne bien dans de nombreuses applications. La méthode de Gini génère généralement des arbres qui comprennent de petits nœuds avec une forte concentration de la réponse d’intérêt.
Entropie: La méthode de l’entropie est proportionnelle au maximum de certaines fonctions de vraisemblance pour le nœud.
Twoing: La méthode Twoing n’est disponible qu’avec une réponse multinomiale. La méthode Twoing génère généralement des divisions plus équilibrées que les méthodes de Gini ou d’Entropy. Pour une réponse binaire, la méthode Twoing est la même que la méthode de Gini.
Probabilité de classe: L’arbre de probabilité a tendance à être plus grand que l’arbre de Gini. Utilisez la méthode des probabilités lorsque vous vous intéressez aux performances de quelques nœuds supérieurs.
Critère de sélection d'un arbre
optimal
Choisissez l’un des critères suivants pour sélectionner l’arborescence dans les résultats. Vous pouvez comparer les résultats de différents arbres pour déterminer le meilleur choix pour votre application.
Coût minimum de
mauvais classement: Sélectionnez cette option pour afficher les résultats de l’arborescence qui minimise le coût de l’erreur de classification.
Dans K erreurs
types du coût minimal de mauvais classement ; K =: Sélectionnez cette option pour afficher les résultats de l’arbre le plus petit avec un coût d’erreur de classification compris dans K erreurs standard du coût minimum d’erreur de classification. Par défaut, K=1, de sorte que les résultats sont pour le plus petit arbre avec un coût d’erreur de classification inférieur à 1 erreur standard de l’arbre avec le coût d’erreur de classification minimal.
Nombre de
substituts pour un prédicteur avec des valeurs manquantes
Entrez le nombre de substituts que Minitab recherche lorsqu’un prédicteur a des valeurs manquantes. Lorsque de nombreux prédicteurs ont des modèles de valeurs manquantes similaires, vous devez augmenter le nombre de substituts.
Ce nombre représente le nombre maximal de substituts recherchés par Minitab. Cependant, il se peut que ce nombre de mères porteuses ne soit pas réellement trouvé.
La valeur par défaut est 10.
Nombre
minimal de cas pour diviser un nœud interne
Entrez le nombre minimal d’incidents qu’un nœud peut avoir et être toujours divisé en plusieurs nœuds. La valeur par défaut est 10. Avec des échantillons de plus grande taille, vous voudrez peut-être augmenter ce minimum. Par exemple, si un noeud interne comporte 10 cas ou plus, Minitab tente d’effectuer une fractionnement. Si le nœud interne présente 9 cas ou moins, Minitab n’essaie pas d’effectuer une fractionnement.
La limite du nœud interne doit être au moins le double de la limite du nœud terminal, mais des rapports plus élevés sont préférables. Les limites de nœuds internes d’au moins 3 fois les limites de nœuds terminaux permettent un nombre raisonnable de séparateurs.
Nombre
minimal de cas autorisés pour un nœud terminal
Entrez le nombre minimal de cas qui peuvent se trouver dans un nœud terminal. La valeur par défaut est 3. Avec des échantillons de plus grande taille, vous voudrez peut-être augmenter ce minimum. Par exemple, si une division crée un nœud avec moins de 3 cas, Minitab n’effectue pas de division.
Profondeur
maximale de l'arbre
Entrez une valeur pour représenter la profondeur maximale d’un arbre. Le nœud racine correspond à une profondeur de 1. Si vous voulez être sûr d’obtenir le meilleur arbre, vous devez permettre un arbre plus profond, même si cela peut ralentir le traitement.
Pondérations
Entrez une colonne contenant les poids des incidents. La colonne doit avoir le même nombre de lignes que la colonne de réponse. Les valeurs doivent être ≥ 0. Minitab omet les lignes qui contiennent des valeurs manquantes ou des zéros dans l’analyse.