Généralités sur Ajuster le modèle et Découvrir les prédicteurs principaux pour Classification TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Utilisez la fonction Classification TreeNet® afin de générer des arbres de classification à gradient renforcé pour une réponse de catégorie avec de nombreuses variables de prédiction continues et de catégorie. Classification TreeNet® constitue une avancée révolutionnaire dans le domaine des technologies d'exploration de données développée par Jerome Friedman, l'un des chercheurs en exploration de données les plus éminents au monde. Cet outil flexible et puissant d'exploration de données est capable de générer des modèles extrêmement précis et adaptés avec une rapidité exceptionnelle ainsi qu'une tolérance élevée pour les données désordonnées ou incomplètes.

Par exemple, un chargé d'études de marché peut utiliser Classification TreeNet® pour identifier les clients avec des taux de réponse plus élevés à des initiatives spécifiques et pour prévoir ces taux de réponse.

Classification CART® est un outil d'analyse exploratoire de données efficace et fournit un modèle facile à comprendre pour identifier rapidement les prédicteurs importants. Toutefois, après l'exploration initiale avec Classification CART®, envisagez d'utiliser Classification TreeNet® comme étape de suivi nécessaire. Classification TreeNet® fournit un modèle hautes performances et plus complexe qui peut se composer de plusieurs centaines de petits arbres. Chaque arbre contribue dans une petite mesure au modèle global. En fonction des résultats de Classification TreeNet®, vous pouvez obtenir des informations sur la relation entre une réponse de catégorie et les prédicteurs importants d'un grand nombre de prédicteurs candidats, et prédire avec une grande précision les probabilités de la classe de réponse pour les nouvelles observations.

L'analyse Classification TreeNet® génère des diagrammes de dépendance partielle à un et deux prédicteurs. Ces courbes vous aident à évaluer comment les modifications des variables de prédiction clés affectent les valeurs de réponse. Ainsi, ces informations peuvent être utiles pour contrôler les paramètres qui permettent d'obtenir un résultat de production optimal.

L'analyse Classification TreeNet® fournit également la possibilité d’essayer différents hyperparamètres pour un modèle. Le taux d’apprentissage et la fraction du sous-échantillon sont des exemples d’hyperparamètres. L’exploration de différentes valeurs est une méthode courante pour améliorer les performances du modèle.

Pour une introduction plus complète de la méthodologie CART®, voir Breiman, Friedman, Olshen et Stone (1984)1 et 2.

Ajuster le modèle

Utilisez la fonction Ajuster le modèle pour produire un modèle à arbres de classification à gradient renforcé pour une réponse de catégorie avec de nombreuses variables de prédiction continues et de catégorie. Les résultats sont pour le modèle du processus d’apprentissage de log de vraisemblance maximal, l'aire maximale sous la courbe ROC, ou le taux minimal de mauvais classement.

Découvrir les prédicteurs principaux

Pour un ensemble de données avec de nombreux prédicteurs, où certains prédicteurs ont moins d’effet sur la réponse que d’autres, envisagez l’utilisation de Découvrir les prédicteurs principaux pour éliminer les prédicteurs sans importance du modèle. La suppression des prédicteurs sans importance aide à clarifier les effets des prédicteurs les plus importants et améliore l’exactitude de la prédiction. L’algorithme supprime les prédicteurs les moins importants d’une manière séquentielle, présente les résultats qui permettent de comparer les modèles avec différents nombres de prédicteurs, et produit des résultats pour l’ensemble des prédicteurs avec la meilleure valeur du critère de précision.

Par exemple, un chercheur en marché utilise Découvrir les prédicteurs principaux pour identifier automatiquement une douzaine de prédicteurs à partir d’un ensemble de 500 prédicteurs qui modélisent efficacement les clients qui ont des taux de réponse plus élevés à des initiatives spécifiques.

Découvrir les prédicteurs principaux peut également supprimer les prédicteurs les plus importants pour évaluer quantitativement l’effet de chaque prédicteur important sur l’exactitude de prédiction d’un modèle.

Où trouver cette analyse ?

Pour effectuer Ajuster le modèle, sélectionnez Module d'analyse prédictive > Classification TreeNet® > Ajuster le modèle.

Pour effectuer Découvrir les prédicteurs principaux, sélectionnez Module d'analyse prédictive > Classification TreeNet® > Découvrir les prédicteurs principaux.

Quand utiliser une autre analyse ?

Pour essayer un modèle de régression paramétrique avec une variable de réponse binaire, utilisez Ajuster le modèle logistique binaire.

Pour comparer les performances d’un modèle de classification Random Forests®, utilisez Classification Random Forests®

1 Breiman, Friedman, Olshen et Stone. (1984). Classification and Regression Trees. Boca Raton, Florida : Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer. (2010). Recursive Partitioning and Applications. New York, New York: Springer