Exemple pour la fonction Régression sur les meilleurs sous-ensembles

Au cours d'une série de mesures sur l'énergie héliothermique, des techniciens mesurent le flux thermique. Des énergéticiens souhaitent déterminer l'influence de plusieurs variables sur le flux thermique total : l'ensoleillement, la position des points focaux (à l'est, au sud et au nord) et l'heure de la journée.

Pour sélectionner un groupe de modèles probables pour une analyse ultérieure, les techniciens utilisent la régression sur les meilleurs sous-ensembles. Dans Minitab, la régression sur les meilleurs sous-ensembles utilise le critère R2 maximal pour sélectionner les modèles probables.

  1. Ouvrez le fichier de données échantillons, TestEnergThermiq.MTW.
  2. Sélectionnez Stat > Régression > Régression > Meilleurs sous‑ensembles.
  3. Dans la zone Réponse, saisissez 'Flux thermique'.
  4. Dans la zone Prédicteurs libres, saisissez Isolation-'Heure journée'.
  5. Cliquez sur OK.

Interprétation des résultats

Les techniciens déterminent plusieurs modèles méritant un examen plus approfondi. Le modèle contenant les cinq prédicteurs est celui qui présente la plus faible valeur de S et le plus fort R2 ajusté, respectivement 8 et 88 % environ. L'un des modèles à quatre prédicteurs présente le plus faible Cp de Mallows, 5,8. Deux modèles, un à deux prédicteurs et l'autre à trois, ont le R2 prévu le plus élevé, soit environ 81,4 %. Avant de choisir le modèle final, les techniciens vérifient si les modèles contredisent les hypothèses de régression, à l'aide de graphiques des valeurs résiduelles et d'autres mesures de diagnostic.

Réponse : Flux thermique

VarsR carréR carré
(ajusté)
R carré
(prév)
Cp de
Mallows
SI
s
o
l
a
t
i
o
n
E
s
t
S
u
d
N
o
r
d
H
e
u
r
e

j
o
u
r
n
é
e
172,171,066,938,512,328      X 
139,437,126,3112,718,154X       
285,984,881,49,18,9321    XX 
282,080,674,217,810,076      XX
387,485,979,07,68,5978  XXX 
386,584,981,49,78,9110X  XX 
489,187,380,65,88,1698XXXX 
488,086,079,38,28,5550X  XXX
589,987,778,86,08,0390XXXXX