Généralités sur Classification Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Utilisez la fonction Classification Random Forests® afin de créer un modèle de prédiction hautes performances pour une réponse de catégorie avec de nombreuses variables de prédiction continues et de catégorie. La fonction Classification Random Forests® combine les informations de nombreux arbres CART® et contribue ainsi significativement aux progrès des technologies d'exploration de données.

Classification Random Forests® fournit des informations pour un large éventail d'applications, y compris le contrôle de la qualité de fabrication, la découverte de médicaments, la détection des fraudes, l'évaluation de crédit et la prévision des résiliations. Utilisez les résultats pour identifier des variables importantes, pour identifier les groupes ayant des caractéristiques souhaitables dans les données et pour prédire les valeurs de réponse pour les nouvelles observations. Par exemple, un chargé d'études de marché peut utiliser Classification Random Forests® pour identifier les clients avec des taux de réponse plus élevés à des initiatives spécifiques et pour prévoir ces taux de réponse.

Classification CART® est un outil d'analyse exploratoire de données efficace et fournit un modèle facile à comprendre pour identifier rapidement les prédicteurs importants. Toutefois, après l'exploration initiale avec Classification CART®, envisagez d'utiliser Classification TreeNet® ou Classification Random Forests® comme étape de suivi nécessaire.

Les résultats de la fonction Classification Random Forests® comprennent des courbes d'importance relative des variables, des courbes ROC ainsi que des courbes de lift et des gains. Ces diagrammes vous aident à évaluer la précision des variables du modèle prédisant les classes de réponse et à identifier les prédicteurs les plus importants pour l'exactitude de prédiction. Ces informations sont utiles lorsque vous souhaitez contrôler les paramètres qui permettent d'obtenir un résultat de production optimal.

Cette méthode a été développée par Leo Breiman et Adele Cutler de l'Université de Californie à Berkeley.

Où trouver cette analyse ?

Pour effectuer Classification Random Forests®, sélectionnez Module d'analyse prédictive > Classification Random Forests®.

Quand utiliser une autre analyse ?

Si vous souhaitez essayer un modèle de régression paramétrique avec une variable de réponse de catégorie, utilisez Ajuster le modèle logistique binaire.