Généralités sur Ajuster le modèle et Découvrir les prédicteurs principaux pour Régression TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Utilisez la fonction Régression TreeNet® afin de générer des arbres de régression à gradient renforcé pour une réponse continue avec de nombreuses variables de prédiction continues et de catégorie. Régression TreeNet® constitue une avancée révolutionnaire dans le domaine des technologies d'exploration de données développée par Jerome Friedman, l'un des chercheurs en exploration de données les plus éminents au monde. Cet outil flexible et puissant d'exploration de données est capable de générer des modèles extrêmement précis et adaptés avec une rapidité exceptionnelle ainsi qu'une tolérance élevée pour les données désordonnées ou incomplètes.

Un chercheur médical peut par exemple utiliser Régression TreeNet® pour identifier les patients ayant des taux de réponse plus élevés à des traitements spécifiques et pour prévoir ces taux de réponse.

Régression CART® est un outil d'analyse exploratoire de données efficace et fournit un modèle facile à comprendre pour identifier rapidement les prédicteurs importants. Toutefois, après l'exploration initiale avec Régression CART®, envisagez d'utiliser Régression TreeNet® comme étape de suivi nécessaire. Régression TreeNet® fournit un modèle hautes performances et plus complexe qui peut se composer de plusieurs centaines de petits arbres. Chaque arbre contribue dans une petite mesure au modèle global. En fonction des résultats de Régression TreeNet®, on peut obtenir des informations sur la relation entre une réponse continue et les prédicteurs importants d'un grand nombre de candidats prédicteurs, et prédire avec une grande précision les réponses pour les nouvelles observations.

L'analyse Régression TreeNet® génère des diagrammes de dépendance partielle à un et deux prédicteurs. Ces courbes vous aident à évaluer comment les modifications des variables de prédiction clés affectent les valeurs de réponse. Ainsi, ces informations peuvent être utiles pour contrôler les paramètres qui permettent d'obtenir un résultat de production optimal.

L'analyse Régression TreeNet® fournit également la possibilité d’essayer différents hyperparamètres pour un modèle. Le taux d’apprentissage et la fraction du sous-échantillon sont des exemples d’hyperparamètres. L’exploration de différentes valeurs est une méthode courante pour améliorer les performances du modèle.

Pour une introduction plus complète de la méthodologie CART®, voir Breiman, Friedman, Olshen et Stone (1984)1 et 2.

Ajuster le modèle

Utilisez la fonction Ajuster le modèle pour produire un modèle à arbres de régression à gradient renforcé pour une réponse continue avec de nombreuses variables de prédiction continues et de catégorie. Les résultats sont pour le modèle du processus d’apprentissage avec la valeur R2 maximale ou le moindre écart absolu minimal.

Découvrir les prédicteurs principaux

Pour un ensemble de données avec de nombreux prédicteurs, où certains prédicteurs ont moins d’effet sur la réponse que d’autres, envisagez l’utilisation de Découvrir les prédicteurs principaux pour éliminer les prédicteurs sans importance du modèle. La suppression des prédicteurs sans importance aide à clarifier les effets des prédicteurs les plus importants et améliore l’exactitude de la prédiction. L’algorithme supprime les prédicteurs les moins importants d’une manière séquentielle, présente les résultats qui permettent de comparer les modèles avec différents nombres de prédicteurs, et produit des résultats pour l’ensemble des prédicteurs avec la meilleure valeur du critère de précision.

Un chimiste utilise par exemple Découvrir les prédicteurs principaux pour identifier automatiquement une douzaine de prédicteurs à partir d’un ensemble de 500 prédicteurs qui modélisent efficacement la viscosité dans un nouveau mélange de carburant.

Découvrir les prédicteurs principaux peut également supprimer les prédicteurs les plus importants pour évaluer quantitativement l’effet de chaque prédicteur important sur l’exactitude de prédiction d’un modèle.

Où trouver cette analyse ?

Pour effectuer Ajuster le modèle, sélectionnez Module d'analyse prédictive > Régression TreeNet® > Ajuster le modèle.

Pour effectuer Découvrir les prédicteurs principaux, sélectionnez Module d'analyse prédictive > Régression TreeNet® > Découvrir les prédicteurs principaux.

Quand utiliser une autre analyse ?

Si vous souhaitez essayer un modèle de régression paramétrique avec une variable de réponse continue, utilisez Ajuster le modèle de régression.

Pour comparer les performances d’un modèle de régression Random Forests®, utilisez Régression Random Forests®.

1 Breiman, Friedman, Olshen et Stone. (1984). Classification and Regression Trees. Boca Raton, Florida : Chapman & Hall/CRC.
2 H. Zhang and B.H. Singer. (2010). Recursive Partitioning and Applications. New York, New York: Springer