Régression sur les meilleurs sous-ensembles - Généralités

La fonction Régression sur les meilleurs sous-ensembles permet de comparer différents modèles de régression contenant des sous-ensembles des prédicteurs spécifiés. Minitab sélectionne les modèles les mieux ajustés contenant un prédicteur, deux prédicteurs, etc. Les modèles les mieux ajustés sont ceux dont les valeurs de R2 sont les plus élevées. Utilisez la régression sur les meilleurs sous-ensembles lorsque votre variable de réponse est continue et que les donnés contiennent plusieurs prédicteurs continus.

La régression sur les meilleurs sous-ensembles offre un moyen efficace de déterminer les modèles offrant un ajustement adéquat aux données avec un minimum de prédicteurs. Les modèles qui contiennent un sous-ensemble des prédicteurs peuvent estimer les coefficients de régression et prévoir les réponses futures avec une plus petite variance que le modèle incluant tous les prédicteurs.

Par exemple, un analyste travaillant dans un magasin de vente au détail souhaite prévoir les volumes des ventes. Ces prédicteurs prennent en compte la fréquentation, la population, le revenu moyen et les concurrents directs à proximité du magasin. L'analyste utilise la régression sur les meilleurs sous-ensembles pour déterminer l'ensemble de prédicteurs qui offre la meilleure prévision du volume des ventes.

Où trouver cette analyse ?

Pour effectuer une régression sur les meilleurs sous-ensembles, sélectionnez Stat > Régression > Régression > Meilleurs sous‑ensembles.

Quand utiliser une autre analyse ?

  • Si vos données contiennent des prédicteurs de catégorie, utilisez la fonction Ajuster le modèle de régression avec une procédure pas à pas afin de sélectionner un modèle de régression en ajoutant ou en supprimant automatiquement des prédicteurs en fonction de leur signification statistique.
  • Si vous disposez de prédicteurs de catégorie emboîtés ou aléatoires, utilisez Ajuster le modèle linéaire général si tous les facteurs sont fixes ou Ajuster le modèle à effets mixtes si certains facteurs sont aléatoires.
  • Si votre variable de réponse est une variable de catégorie, utilisez la procédure de régression logistique.