Interprétation des résultats principaux pour la fonction Régression sur les meilleurs sous-ensembles

Pour la régression sur les meilleurs sous-ensembles, Minitab sélectionne les deux modèles à un prédicteur, deux prédicteurs, etc. ayant les plus hautes valeurs de R2. Vous pouvez déterminer les prédicteurs inclus dans chaque modèle en fonction des colonnes marquées d'un "X" dans le tableau des résultats.

Utilisez les statistiques d'adéquation de l'ajustement pour déterminer le modèle qui offre le meilleur ajustement à vos données. Avant de choisir le modèle final, vous devez étudier des graphiques des valeurs résiduelles et d'autres mesures de diagnostic pour vérifier qu'il vérifie les hypothèses de l'analyse.

R carré

Plus la valeur R2 est élevée, plus le modèle est ajusté à vos données. R2 est toujours compris entre 0 et 100 %.

La valeur R2 augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, R2 est surtout utile pour comparer des modèles de même taille.

R carré (ajusté)

Utilisez la valeur R2 ajusté pour comparer des modèles n'ayant pas le même nombre de prédicteurs. R2 augmente toujours lorsque vous ajoutez un prédicteur au modèle, même lorsque ce prédicteur n'apporte aucune amélioration réelle au modèle. La valeur de R2 ajusté intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.

R carré (prév)

La valeur R2 prévu permet de déterminer la capacité de votre modèle à prévoir la réponse pour de nouvelles observations. Les modèles ayant des valeurs de R2 prévu élevées ont une meilleure capacité de prévision.

Une valeur de R2 prévu considérablement inférieure à R2 peut être un signe de surajustement du modèle. Un modèle est dit surajusté lorsqu'il inclut des termes pour des effets qui ne sont pas importants dans la population. Le modèle est alors spécialement ajusté aux données des échantillons, mais risque ne pas être utile pour effectuer des prévisions concernant la population entière.

La valeur R2 prévu peut également être plus utile que R2 ajusté pour comparer des modèles, car elle est calculée avec des observations qui ne sont pas incluses dans le calcul du modèle.

Cp de Mallows
Le Cp de Mallows compare la précision et le biais du modèle complet aux modèles ayant les meilleurs sous-ensembles de prédicteurs. Une valeur du Cp de Mallows proche de la somme de la constante et du nombre de prédicteurs indique que le modèle génère des estimations relativement précises et non biaisées.
S

Utilisez S pour évaluer la capacité du modèle à décrire la réponse. Utilisez S plutôt que les statistiques R2 pour comparer l'ajustement des modèles qui n'ont pas de constante.

S est mesuré en unités de la variable de réponse et représente la distance entre les valeurs de données et les valeurs ajustées. Plus S est petit, mieux le modèle décrit la réponse. Cependant, une faible valeur de S n'indique pas en soi que le modèle respecte les hypothèses du modèle. Vous devez examiner les graphiques des valeurs résiduelles pour vérifier les hypothèses.

Prenez en compte les points suivants lors de l'interprétation des valeurs de R2 :
  • Les petits échantillons ne fournissent pas d'estimation précise de la force de la relation entre la réponse et les prédicteurs. Pour obtenir une valeur R2 plus précise, vous devez utiliser un échantillon plus grand (en général, 40 ou plus).

  • R2 n'est qu'une des mesures de l'ajustement du modèle aux données. Même si un modèle a une valeur R2 élevée, vous devez consulter les graphiques des valeurs résiduelles pour vérifier que le modèle respecte les hypothèses.

Régression sur les meilleurs sous-ensembles : Flux thermiq en fonction de Isola

Réponse : Flux thermique H e u r I e s o j l o a u t N r i E S o n R carré R carré Cp de o s u r é Vars R carré (ajust) (prév) Mallows S n t d d e 1 72,1 71,0 66,9 38,5 12,328 X 1 39,4 37,1 26,3 112,7 18,154 X 2 85,9 84,8 81,4 9,1 8,9321 X X 2 82,0 80,6 74,2 17,8 10,076 X X 3 87,4 85,9 79,0 7,6 8,5978 X X X 3 86,5 84,9 81,4 9,7 8,9110 X X X 4 89,1 87,3 80,6 5,8 8,1698 X X X X 4 88,0 86,0 79,3 8,2 8,5550 X X X X 5 89,9 87,7 78,8 6,0 8,0390 X X X X X
Résultats principaux : R carré, R carré (ajust), R carré (prév), S, Cp de Mallows

Dans ces résultats, plusieurs modèles méritent un examen plus approfondi. Le modèle contenant les cinq prédicteurs est celui qui présente la plus faible valeur de S et le plus fort R2 ajusté, respectivement 8 et 88 % environ. Deux modèles, un à deux prédicteurs et l'autre à trois, ont le R2 prévu le plus élevé, soit environ 81,4 %. Avant de choisir le modèle final, vous devez vérifier si les modèles contredisent les hypothèses de régression, à l'aide de graphiques des valeurs résiduelles et d'autres mesures de diagnostic.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique