Méthodes et formules pour la sélection de modèle dans Régression par les moindres carrés partiels

Sélectionnez la méthode ou la formule de votre choix.

R carré

Le R2 est également appelé coefficient de détermination.

Formule

Notation

TermeDescription
yi ie valeur de réponse observée
réponse moyenne
ie réponse ajustée

Somme des carrés

Somme des carrés des distances. La régression de la somme des carrés est la partie de la variation expliquée par le modèle. L'erreur de la somme des carrés est la partie non expliquée par le modèle et est attribuée à l'erreur. La somme des carrés totale est la variation totale des données.

Formule

Régression SC :
Erreur SC :
Total SC :

Notation

TermeDescription
yiith valeur de réponse observée
ie réponse ajustée
réponse moyenne

PRESS

La statistique de somme des carrés des erreurs de prévision (SomCar-ErrPrév) évalue les capacités de prévision de votre modèle. Semblable à la somme des carrés des valeurs résiduelles, SomCar-ErrPrév est la somme des carrés de l'erreur de prévision. Dans PLS, Minitab calcule uniquement SomCar-ErrPrév si vous avez effectué une validation croisée pour le modèle.

Minitab calcule SomCar-ErrPrév selon les étapes suivantes :

  1. Minitab recalcule le modèle autant de fois qu'il existe d'observations, en omettant une observation différente à chaque fois. Pour chaque observation omise, Minitab calcule la réponse ajustée ou prévue à l'aide du modèle.
  2. Minitab soustrait la valeur prévue de la valeur de la réponse observée. Il s'agit de l'erreur de prévision réelle, car l'ajustement de l'observation est indépendant du modèle.
  3. Après avoir réalisé ces opérations pour toutes les observations, Minitab calcule SomCar-ErrPrév à l'aide de la formule suivante :

En général, plus la valeur SomCar-ErrPrév est petite, meilleure est la capacité de prévision du modèle. SomCar-ErrPrév permet de calculer le R2 prévu.

Notation

TermeDescription
yiréponse observée
réponse ajustée pour l'observation omise
nnombre d'observations

R carré (prév)

Minitab affiche zéro lorsque les calculs de R2 (prév) génèrent des valeurs négatives.

Notation

TermeDescription
yi ie valeur de réponse observée
réponse moyenne
n nombre d'observations
ei ie valeur résiduelle
hi ie élément sur la diagonale de X(X'X)–1X'
X matrice du plan

R carré du test

Indique si le modèle PLS prévoit correctement vos données de test. Le R2 du test représente la proportion de variation des réponses qui est expliquée par les prédicteurs dans votre fichier de données de test. Généralement, les données de test permettent de valider le modèle ajusté et doivent comprendre le même nombre de prédicteurs que le fichier d'origine. Le R2 du test ne peut être calculé que si les données de test comprennent des données de réponse pour chaque observation. Le R2 du test est calculé de la même manière que le R2 avec la formule suivante :