Méthodes pour Ajuster le modèle de régression et Regressão Linear

Sélectionnez la méthode ou la formule de votre choix.

Régression pondérée

La régression par les moindres carrés pondérée est une méthode permettant de traiter les observations qui présentent des variances non constantes. Si les variances ne sont pas constantes, attribuez :

  • des pondérations relativement faibles aux observations ayant des variances importantes
  • des pondérations relativement importantes aux observations ayant des variances faibles

Les pondérations sont généralement choisies comme l'inverse de la variance de l'erreur pure dans le réponse.

La formule pour les coefficients estimés est la suivante :
Cela revient à minimiser la valeur SC Erreur pondérée.

Notation

TermeDescription
Xmatrice du plan
X'transposition de la matrice de plan
Wmatrice n x n, avec les pondérations sur la diagonale
Yvecteur des valeurs de réponse
nnombre d'observations
wipondération pour l'ie observation
yivaleur de réponse pour l'ie observation
valeur ajustée pour l'ie observation

Transformation de Box-Cox

La transformation de Box-Cox sélectionne les valeurs lambda (comme indiqué ci-dessous) qui minimisent la somme des carrés des valeurs résiduelles. La transformation obtenue est Y λ lorsque λ ≠ 0, et ln(Y) lorsque λ = 0. Lorsque λ < 0, Minitab multiplie également la réponse transformée par −1 pour conserver l'ordre de la réponse non transformée.

Minitab recherche une valeur optimale entre −2 et 2. Les valeurs en dehors de cet intervalle sont susceptibles de ne pas fournir un meilleur ajustement.

Voici quelques transformations courantes dans lesquelles Y′ représente la transformation des données Y :

Valeur lambda (λ) Transformation
λ = 2 Y′ = Y 2
λ = 0,5 Y′ =
λ = 0 Y′ = ln(Y )
λ = −0,5
λ = −1 Y′ = −1 / Y

Equation de régression

Pour un modèle avec plusieurs prédicteurs, l'équation est la suivante :

y = β0 + β1x1 + … + βkxk + ε

L'équation ajustée est la suivante :

Dans la régression linéaire simple, qui comprend un seul prédicteur, le modèle est le suivant :

y=ß0+ ß1x1+ε

A l'aide des estimations de régression b0 pour ß0 et b1 pour ß1, l'équation ajustée est la suivante :

Notation

TermeDescription
yvariable
xkke terme. Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d'interaction.
ßkke coefficient de régression de la population
εterme d'erreur qui suit une loi normale avec une moyenne de 0
bkestimation du ke coefficient de régression de la population
réponse ajustée

Matrice du plan

La matrice du plan contient les prédicteurs dans une matrice (X) de n lignes, où n correspond au nombre d'observations. Il existe une colonne pour chaque coefficient du modèle.

Les prédicteurs de catégories sont codés à l'aide du codage 1, 0 ou -1, 0, 1. X n'inclut pas de colonne pour le niveau de référence du facteur.

Pour calculer les colonnes d'un terme d'interaction, multipliez toutes les valeurs correspondantes des prédicteurs dans l'interaction. Par exemple, supposons que la première observation a une valeur de 4 pour le prédicteur A et une valeur de 2 pour le prédicteur B. Dans la matrice du plan, l'interaction entre A et B est représentée par le chiffre 8 (4 x 2).

Inverse de x'x

Matrice p x p, dans laquelle p représente le nombre de coefficients dans le modèle. La multiplication de la valeur inverse x'x par le carré moyen de l'erreur génère la matrice de variance/covariance des coefficients. Minitab utilise également la valeur inverse x'x pour calculer les coefficients de régression et la matrice chapeau.

Procédure pour supprimer des prédicteurs fortement corrélés de l'équation de régression dans Ajuster le modèle de régression

Supposons que rij est l'élément dans la matrice de balayage associé à Xi et Xj.

Les variables sont saisies ou supprimées une à une. Xk est éligible à la saisie s'il correspond à une variable indépendante ne se trouvant pas actuellement dans le modèle avec rkk ≥ 1 (tolérance avec une valeur par défaut de 0,0001) et également pour chaque variable Xj se trouvant actuellement dans le modèle,

Pour supprimer des prédicteurs fortement corrélés d'une équation de régression, Minitab suit les étapes suivantes :
  1. Minitab exécute la méthode SWEEP sur la matrice de corrélation, R, traitant X1 … Xp comme s'il s'agissait de variables aléatoires.
  2. Pour tout prédicteur continu, Minitab compare l'élément rkk avec la tolérance ; rkk ≥ tolérance, où k = 1 par rapport à p.
  3. Pour chaque variable Xj se trouvant actuellement dans le modèle, Minitab vérifie que (rjj – rjk * (rkj / rkk)) * tolérance ≤ 1.
    Remarque

    Où rkk, rjk, rjj sont les éléments de diagonale et hors diagonale correspondant aux variables Xj et Xk après l'étape k des opérations SWEEP.

  4. Dans le cas contraire, le prédicteur échoue au test et est supprimé du modèle.
    Remarque

    La valeur de tolérance par défaut est de 8,8e-12.

Remarque

Vous pouvez utiliser la sous-commande TOLERANCE avec la session de commande REGRESS pour forcer Minitab à conserver dans le modèle un prédicteur fortement corrélé avec un autre prédicteur. Cependant, diminuer la tolérance peut s'avérer dangereux, car cela peut générer des résultats imprécis sur le plan numérique.