Évaluation des modèles par élimination des prédicteurs importants ou non pour Découvrir les prédicteurs principaux avec Régression TreeNet^®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Trouvez des définitions et des pistes d’interprétation pour le tableau d'évaluation des modèles.

Remarque

Lorsque vous spécifiez les options pour Découvrir les prédicteurs principaux, vous pouvez choisir les résultats de sélection des modèles pour les données d'apprentissage et de test. Les résultats de test indiquent si le modèle peut prédire de manière adaptée les valeurs de réponse pour les nouvelles observations, ou récapituler correctement les relations entre les variables de réponse et de prédiction. Les résultats d'apprentissage sont généralement pour référence seulement.

Utilisez les résultats pour comparer les modèles à différentes étapes. Pour explorer davantage un modèle alternatif à partir du tableau, cliquez sur Sélectionner un autre modèle. Minitab produit un ensemble complet de résultats pour le modèle alternatif. Vous pouvez affiner les hyperparamètres et faire des prédictions en conséquence.

Nombre optimal d'arbres

Le nombre optimal d’arbres est habituellement différent à chaque étape. Si le nombre optimal est proche du nombre total d’arbres pour l’analyse, le modèle est plus susceptible de s’améliorer. Vous pouvez vous demander s’il est possible d’explorer davantage un modèle alternatif qui semble susceptible de s’améliorer.

R carré (%)

Le R² est le pourcentage de variation dans la réponse que le modèle explique. Les valeurs R² varient de 0 % à 100 %.

Lorsque vous utilisez la fonction de perte d’erreur quadratique ou la fonction de perte Huber, le tableau inclut la valeur R² pour chaque modèle. Les résultats qui suivent sont pour le modèle avec la valeur R^{2 la plus} élevée. Si un modèle ayant un plus petit nombre de termes a une valeur R² proche de la valeur optimale, envisagez ou non d’explorer davantage le modèle alternatif. Un modèle avec moins de prédicteurs est plus facile à interpréter et permet de travailler avec un plus petit nombre de prédicteurs.

MAD

L’écart absolu moyen (MAD) est la moyenne de la valeur absolue de la différence entre une valeur prévue et une valeur réelle. Plus le MAD est faible, plus le modèle est ajusté aux données. Le MAD exprime l'exactitude dans les mêmes unités que les données, ce qui aide à conceptualiser l'importance de l'erreur.

Lorsque vous utilisez la fonction de perte d’écart absolue, le tableau inclut la valeur MAD pour chaque modèle. Les résultats complets qui suivent le tableau sont pour le modèle ayant la valeur MAD la plus basse. Si un modèle ayant un plus petit nombre de termes a une valeur MAD proche de la valeur optimale, envisagez ou non d’explorer davantage le modèle alternatif. Un modèle avec moins de prédicteurs est plus facile à interpréter et permet de travailler avec un plus petit nombre de prédicteurs.

Nombre de prédicteurs

Le nombre de prédicteurs indique le nombre de prédicteurs du modèle. Le nombre de prédicteurs dans la première ligne du tableau intègre toujours tous les prédicteurs que l’analyse prend en compte. Après la première ligne, le nombre de prédicteurs dépend de l’analyse selon qu'elle élimine ou non les prédicteurs sans importance ou les prédicteurs importants.

Lorsque l’analyse supprime les prédicteurs les moins importants, le nombre de prédicteurs diminue d’un nombre spécifié de prédicteurs à chaque étape, plus tous les prédicteurs qui ont des scores d’importance de 0. Si par exemple l’analyse élimine 10 prédicteurs par étape, a 900 prédicteurs, et 450 prédicteurs de scores d’importance de 0 dans le modèle initial, la première ligne du tableau a 900 prédicteurs. La deuxième ligne a 440 prédicteurs parce que l’analyse supprime les 450 prédicteurs de scores d’importance de 0 et les 10 prédicteurs les moins importants.

Lorsque l’analyse supprime les prédicteurs les plus importants, le nombre de prédicteurs diminue du nombre spécifié de prédicteurs à chaque étape. Les prédicteurs qui ont une importance 0 demeurent dans le modèle.

Prédicteurs éliminés

La colonne affiche les prédicteurs éliminés à chaque étape. La liste affiche au plus 25 titres de prédicteurs à une étape. La première ligne affiche toujours "Aucun" parce que le modèle a tous les prédicteurs. Après la première ligne, le nombre de prédicteurs dépend de l’analyse selon qu'elle élimine ou non les prédicteurs sans importance ou les prédicteurs importants.

Lorsque l’analyse supprime les prédicteurs les moins importants, le nombre de prédicteurs diminue d’un nombre spécifié de prédicteurs à chaque étape, plus tous les prédicteurs qui ont des scores d’importance 0. Si l’analyse élimine les prédicteurs qui ont un score d’importance 0, ces prédicteurs sont les premiers dans la liste. Lorsque l’analyse élimine plus d’un prédicteur dans l’une ou l’autre catégorie, l’ordre des noms est celui des prédicteurs de la feuille de travail.

Lorsque l’analyse supprime les prédicteurs les plus importants, la liste affiche les prédicteurs éliminés à chaque étape. Lorsque l’analyse élimine plus d’un prédicteur important à une étape, l’ordre des noms dans la liste est celui des prédicteurs de la feuille de travail.

Évaluation des modèles par élimination des prédicteurs importants ou non pour Découvrir les prédicteurs principaux avec Régression TreeNet®

Remarque

Remarque

Sur ce thème

Nombre optimal d'arbres

R carré (%)

MAD

Nombre de prédicteurs

Prédicteurs éliminés

Évaluation des modèles par élimination des prédicteurs importants ou non pour Découvrir les prédicteurs principaux avec Régression TreeNet^®