Exemple de Découvrir les prédicteurs principaux pour Régression TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Une équipe de chercheurs veut utiliser les données d’un processus de moulage par injection pour étudier les paramètres des machines qui optimisent un type de résistance d’une pièce en plastique. Les variables incluent des contrôles sur les machines, différentes formules de plastique, et les machines de moulage par injection.

Dans le cadre de l’exploration initiale des données, l'équipe décide d’utiliser Découvrir les prédicteurs principaux pour comparer les modèles en supprimant séquentiellement les prédicteurs sans importance pour identifier les principaux prédicteurs. Les chercheurs espèrent identifier les principaux prédicteurs qui ont le plus d’effet sur la réponse et mieux comprendre les relations entre la réponse et les principaux prédicteurs.

  1. Ouvrez l'ensemble de données échantillons processus_d’injection.MTW.
  2. Sélectionnez Module d'analyse prédictive > Régression TreeNet® > Découvrir les prédicteurs principaux.
  3. Dans Réponse, saisissez force.
  4. Dans Prédicteurs continus, saisissez pression d’injectiontempérature à mesure .
  5. Dans Prédicteurs de catégorie, saisissez machineformule.
  6. Cliquez sur OK.

Interpréter les résultats

Pour cette analyse, Minitab Statistical Software compare 20 modèles. L’astérisque de la colonne Modèle du tableau d’évaluation du modèle montre que le modèle ayant la plus grande valeur de la statistique R2 à validation croisée est le modèle 16. Le modèle 16 contient 5 prédicteurs importants. Les résultats qui suivent le tableau Évaluation des modèles sont pour le modèle 16.

Bien que le modèle 16 ait la plus grande valeur de la statistique R2 à validation croisée, d’autres modèles ont des valeurs similaires. L’équipe peut cliquer sur Sélectionner un autre modèle pour produire des résultats pour d’autres modèles à partir du tableau Évaluation des modèles.

Dans les résultats du modèle 16, le R carré en fonction du nombre d’arbres montre que le nombre optimal d’arbres est égal au nombre d’arbres dans l’analyse, soit 300. L’équipe peut cliquer sur Affiner les hyperparamètres pour identifier un meilleur modèle pour augmenter le nombre d’arbres et voir si les modifications apportées à d’autres hyperparamètres améliorent les performances du modèle.

La courbe d'importance relative des variables trace les prédicteurs dans l'ordre de leur effet sur l'amélioration du modèle lorsqu'un prédicteur est divisé sur la séquence des arbres. La variable de prédiction la plus importante est Température du moule. Si la contribution de la principale variable de prédiction, c'est-à-dire Température du moule, est de 100 %, alors la variable importante suivante, Machine, présente une contribution de 58,7%. Cela signifie que la machine qui injecte est 58,7% aussi importante que la température à l’intérieur du moule.

Utilisez les diagrammes de dépendance partielle pour mieux comprendre comment les variables ou les paires de variables importantes affectent la réponse prévue. Les valeurs de réponse sur l'échelle de la moitié du logarithme correspondent aux prédictions du modèle. Les diagrammes de dépendance partielle indiquent si la relation entre la réponse et une variable est linéaire, monotone ou plus complexe.

Les diagrammes de dépendance partielle à un prédicteur montrent que la température de moule, la pression d’injection et la température de refroidissement ont toutes une corrélation positive avec la résistance. Le diagramme des machines montre les différences entre les machines, avec la machine 1 faisant les pièces les plus faibles en moyenne et la machine 4 faisant les pièces les plus résistantes en moyenne. L’équipe remarque que la température du moule et la machine ont l’interaction la plus forte dans les données, de sorte qu’ils regardent le diagrammes de dépendance partielle à deux prédicteurs pour mieux comprendre comment ces variables affectent la résistance. L’équipe peut cliquer sur Sélectionner plus de prédicteurs à tracer pour produire des diagrammes pour d’autres variables, telles que la température d’injection.

Le diagrammes de dépendance partielle à deux prédicteurs de la température du moule et de la machine donne un aperçu de la différence de résistance moyenne entre les machines. Une raison est que les données de la machine 1 n’incluent pas autant d’observations aux températures de moule les plus élevées que les autres machines. L’équipe peut encore décider de chercher d’autres raisons pour lesquelles les machines produisent des résistances différentes lorsque d’autres paramètres sont les mêmes. L’équipe peut cliquer sur Sélectionner plus de prédicteurs à tracer pour produire des diagrammes pour d’autres paires de variables.

Régression TreeNet®: force vs pression d’i; température ; température ; ...

Méthode Fonction de perte Erreur quadratique Critères de sélection du nombre d'arbres optimal R carré maximum Validation de modèle Validation croisée pour 3 ensemble(s) Taux d'apprentissage 0,01408 Fraction de sous-échantillon 0,5 Nombre maximal de nœuds terminaux par arbre 6 Taille minimale du nœud terminal 3 Nombre de prédicteurs sélectionnés pour la partition des nœuds Nombre total de prédicteurs = 21 Lignes utilisées 1408
Informations de réponse Moyenne EcTyp Minimum Q1 Médiane Q3 Maximum 485,247 318,611 41,2082 301,099 398,924 562,449 2569,04

Une prévision partielle des parcelles de dépendance

Sélectionner d'autres prédicteurs à représenter...

Deux parcelles de dépendance partielle de Predictor

Sélectionner d'autres prédicteurs à représenter...

Régression TreeNet® - Découvrir les prédicteurs principaux : force vs pression d’i; température ; ...

Graphique d'elimination des prédicteurs

Sélection du modèle en éliminant les prédicteurs non importants Test Nombre optimal Nombre de Modèle d'arbres R carré (%) prédicteurs 1 300 89,32 21 2 300 89,34 19 3 300 89,39 18 4 300 89,46 17 5 300 89,51 16 6 300 89,50 15 7 300 89,59 14 8 300 89,57 13 9 300 89,69 12 10 300 89,70 11 11 300 89,86 10 12 300 89,90 9 13 300 89,92 8 14 300 90,06 7 15 300 90,16 6 16* 300 90,23 5 17 300 89,96 4 18 297 79,37 3 19 244 66,64 2 20 164 46,19 1
Modèle Prédicteurs éliminés 1 Aucun 2 débit en plastique; changer de position 3 température de séchage 4 zone de température de fonte 2 5 température plastique 6 formule 7 maintenir la pression 8 coussin à vis 9 zone de température de fonte 4 10 pression arrière 11 zone de température de fonte 1 12 temps de séchage 13 température à mesure 14 zone de température de fonte 5 15 zone de température de fonte 3 16* vitesse de rotation de vis 17 température d’injection 18 température de refroidissement 19 pression d’injection 20 machine L'algorithme a supprimé un prédicteur et tous les prédicteurs ayant une importance de 0 à chaque étape. * Le modèle sélectionné présente un R carré maximal. Les résultats du modèle sélectionné sont affichés ci-après.

Une prévision partielle des parcelles de dépendance

Sélectionner d'autres prédicteurs à représenter...

Deux parcelles de dépendance partielle de Predictor

Sélectionner d'autres prédicteurs à représenter...

Régression TreeNet®: force vs pression d’i; température ; température ; ...

Récapitulatif du modèle Nombre total de prédicteurs 5 Prédicteurs importants 5 Nombre d'arbres développés 300 Nombre optimal d'arbres 300 Statistiques Apprentissage Test R carré 92,23% 90,23% Racine de l'erreur quadratique moyenne (RMSE) 88,8049 99,5673 Erreur quadratique moyenne (MSE) 7886,3152 9913,6420 Ecart absolu moyen (MAD) 68,9231 74,4113 Pourcentage d'erreur absolue moyen (MAPE) 0,2083 0,2175

Une prévision partielle des parcelles de dépendance

Sélectionner d'autres prédicteurs à représenter...

Deux parcelles de dépendance partielle de Predictor

Sélectionner d'autres prédicteurs à représenter...