Méthodes pour la fonction Régression par les moindres carrés partiels

Sélectionnez la méthode de votre choix.

Sur ce thème

Ajustement de modèles
Validation croisée

Ajustement de modèles

Minitab utilise l'algorithme NIPALS (nonlinear iterative partial least squares) développé par Herman Wold¹ pour résoudre les problèmes associés aux données en mauvais état. PLS réduit le nombre de prédicteurs en extrayant les composantes non corrélées basées sur la covariance entre le prédicteur et les variables de réponse. PLS est semblable à la régression des composantes principales et à la régression ridge, mais sa méthode de calcul diffère.

L'algorithme PLS génère une séquence de modèles, où chaque modèle consécutif contient une composante supplémentaire. Les composantes sont calculées l'une après l'autre, en commençant par la matrice des valeurs X et Y normalisées. Les composantes suivantes sont calculées à partir de la matrice des valeurs résiduelles Y et X ; les itérations cessent lorsque le nombre maximal de composantes est atteint ou lorsque les valeurs résiduelles X deviennent la matrice zéro. Si le nombre de composantes est égal à celui des prédicteurs, le modèle PLS est identique au modèle de régression des moindres carrés. La validation croisée permet d'identifier le nombre de composantes minimisant l'erreur de prévision.

PLS effectue simultanément une décomposition sur les prédicteurs et les réponses. Après avoir déterminé le nombre de composantes et calculé les contributions, Minitab calcule les coefficients de régression pour chaque prédicteur. Pour plus d'informations détaillées sur PLS et NIPALS, reportez-vous à ² ³ ⁴.

Validation croisée

Calcule la capacité de prévision que possèdent les modèles potentiels pour vous aider à déterminer le nombre de composantes à conserver dans votre modèle. Quand les données contiennent plusieurs variables de réponse, Minitab valide les composantes de toutes les réponses simultanément.

Procédure de validation croisée

Pour chaque modèle potentiel, Minitab effectue les opérations suivantes :

Il omet une observation ou un groupe d'observations, selon la méthode de validation croisée utilisée.
Il recalcule le modèle sans l'observation ou le groupe d'observations.
Il prévoit la réponse ou les valeurs ajustées à validation croisée, pour l'observation ou le groupe d'observations omises à l'aide du modèle recalculé et calcule la valeur résiduelle à validation croisée.
Il répète les étapes 1 à 3 jusqu'à ce que toutes les observations soient omises et ajustées.
Il calcule la somme des carrés des erreurs de prévision (SomCarr-ErrPrév) et des valeurs du R² prévu.

Après avoir effectué les étapes 1 à 5 pour chaque modèle, Minitab sélectionne le modèle dans lequel le nombre de composantes produit la valeur de R² prévu la plus élevée et la valeur de somme des carrés des erreurs de prévision la plus basse. Avec plusieurs variables de réponse, Minitab sélectionne le modèle avec la valeur de R² prévu moyenne la plus élevée et la valeur de somme des carrés des erreurs de prévision moyenne la plus faible.

¹ H. Wold (1975). "Soft Modeling by Latent Variables; the Nonlinear Iterative Partial Least Squares Approach", in Perspectives in Probability and Statistics, Papers in Honour of M.S. Bartlett, éd. J. Gani, Academic Press.

² P. Geladi et B. Kowalski (1986). "Partial Least-Squares Regression: A Tutorial", Analytica Chimica Acta, 185, 1-17.

³ A. Hoskuldsson (1988). "PLS Regression Methods", Journal of Chemometrics, 2, 211-228.

⁴ A. Lorber, L. Wangen et B. Kowalski (1987). "A Theoretical Foundation for the PLS Algorithm", Journal of Chemometrics, 1, 19-31.