Exemple de Découvrir les prédicteurs principaux pour Régression TreeNet®

Remarque

Cette commande est disponible avec la commande Module d'analyse prédictive. Cliquez ici pour plus d’informations sur la façon d’activer le module.

Une équipe de chercheurs souhaite utiliser les données d’un processus de moulage par injection pour étudier les paramètres des machines qui maximisent un type de résistance d’une pièce en plastique. Les variables comprennent les commandes sur les machines, les différentes formules de plastique et les machines de moulage par injection.

Dans le cadre de l’exploration initiale des données, l’équipe décide Découvrir les prédicteurs principaux de comparer les modèles en supprimant séquentiellement les prédicteurs sans importance afin d’identifier les prédicteurs clés. Les chercheurs espèrent identifier les principaux prédicteurs qui ont le plus d’effet sur la réponse et mieux comprendre les relations entre la réponse et les principaux prédicteurs.

  1. Ouvrez l’exemple de jeu de données processus_d’injection.MTW.
  2. Choisissez Module d'analyse prédictive > Régression TreeNet® > Découvrir les prédicteurs principaux.
  3. Dans Réponse, entrez force.
  4. Dans Prédicteurs continus, entrez pression d’injectiontempérature à mesure.
  5. Dans Prédicteurs de catégorie, entrez machine et formule.
  6. Cliquez sur OK.

Interpréter les résultats

Pour cette analyse, Minitab Statistical Software compare 20 modèles. L’astérisque dans la colonne Modèle de la table d’évaluation du modèle indique que le modèle avec la valeur la plus élevée de la statistique R2 à validation croisée est le modèle 16. Le modèle 16 contient 5 prédicteurs importants. Les résultats qui suivent le tableau d’évaluation du modèle concernent le modèle 16.

Bien que le modèle 16 ait la plus grande valeur de la statistique R2 à validation croisée, d’autres modèles ont des valeurs similaires. L’équipe peut cliquer Sélectionner un autre modèle pour produire des résultats pour d’autres modèles à partir du tableau d’évaluation du modèle.

Dans les résultats du modèle 16, le graphique R au carré en fonction du nombre d’arbres montre que le nombre optimal d’arbres est égal au nombre d’arbres dans l’analyse, 300. L’équipe peut cliquer Régler les hyperparamètres pour augmenter le nombre d’arbres et voir si les modifications apportées à d’autres hyperparamètres améliorent les performances du modèle.

Le graphique Importance relative des variables trace les prédicteurs dans l’ordre de leur effet sur l’amélioration du modèle lorsque des divisions sont effectuées sur un prédicteur au cours de la séquence d’arbres. La variable prédictive la plus importante est la température du moule. Si l’importance de la variable prédictive principale, la température du moule, est de 100 %, la variable importante suivante, Machine, a une contribution de 58,7 %. Cela signifie que la machine qui injecte est 58,7% aussi importante que la température à l’intérieur du moule.

Utilisez les diagrammes de dépendance partielle pour obtenir des informations sur la façon dont les variables importantes ou les paires de variables affectent la réponse prédite. Les graphiques de dépendance partielle montrent si la relation entre la réponse et une variable est linéaire, monotone ou plus complexe.

Les graphiques de dépendance partielle à un prédicteur montrent que la température du moule, la pression d’injection et la température de refroidissement ont toutes une relation positive avec la résistance. Le graphique des machines montre les différences entre les machines, la machine 1 fabriquant les pièces les plus faibles en moyenne et la machine 4 fabriquant les pièces les plus solides en moyenne. L’équipe remarque que la température du moule et la machine ont l’interaction la plus forte dans les données, ils examinent donc le graphique de dépendance partielle à deux prédicteurs pour mieux comprendre comment ces variables affectent la résistance. L’équipe peut sélectionner Graphiques à un prédicteur dans les résultats de produire des graphiques pour d’autres variables, telles que la température d’injection.

Le graphique de dépendance partielle à deux prédicteurs de la température du moule et de la machine donne un aperçu de la différence de résistance moyenne des machines. L’une des raisons est que les données de la machine 1 ne comprennent pas autant d’observations aux températures de moule les plus élevées que les autres machines. L’équipe pourrait toujours décider de chercher d’autres raisons pour lesquelles les machines produisent des forces différentes lorsque d’autres paramètres sont les mêmes. L’équipe peut cliquer Graphiques à deux prédicteurs sur les résultats pour produire des graphiques pour d’autres paires de variables.

Méthode

Fonction de perteErreur quadratique
Critères de sélection du nombre d'arbres optimalR carré maximum
Validation de modèleValidation croisée pour 3 ensemble(s)
Taux d'apprentissage0,01408
Fraction de sous-échantillon0,5
Nombre maximal de nœuds terminaux par arbre6
Taille minimale du nœud terminal3
Nombre de prédicteurs sélectionnés pour la partition des nœudsNombre total de prédicteurs = 21
Lignes utilisées1408

Informations de réponse

MoyenneEcTypMinimumQ1MédianeQ3Maximum
485,247318,61141,2082301,099398,924562,4492569,04

Sélection du modèle en éliminant les prédicteurs non importants

Test
ModèleNombre
optimal
d'arbres
R carré (%)Nombre de
prédicteurs
Prédicteurs éliminés
130089,3221Aucun
230089,3419débit en plastique; changer de position
330089,3918température de séchage
430089,4617zone de température de fonte 2
530089,5116température plastique
630089,5015formule
730089,5914maintenir la pression
830089,5713coussin à vis
930089,6912zone de température de fonte 4
1030089,7011pression arrière
1130089,8610zone de température de fonte 1
1230089,909temps de séchage
1330089,928température à mesure
1430090,067zone de température de fonte 5
1530090,166zone de température de fonte 3
16*30090,235vitesse de rotation de vis
1730089,964température d’injection
1829779,373température de refroidissement
1924466,642pression d’injection
2016446,191machine
L'algorithme a supprimé un prédicteur et tous les prédicteurs ayant une importance de 0 à
     chaque étape.
* Le modèle sélectionné présente un R carré maximal. Les résultats du modèle sélectionné sont
     affichés ci-après.

Récapitulatif du modèle

Nombre total de prédicteurs5
Prédicteurs importants5
Nombre d'arbres développés300
Nombre optimal d'arbres300
StatistiquesApprentissageTest
R carré92,23%90,23%
Racine de l'erreur quadratique moyenne (RMSE)88,804999,5673
Erreur quadratique moyenne (MSE)7886,31529913,6420
Ecart absolu moyen (MAD)68,923174,4113
Pourcentage d'erreur absolue moyen (MAPE)0,20830,2175