Minitab utilise l'algorithme NIPALS (nonlinear iterative partial least squares) développé par Herman Wold1 pour résoudre les problèmes associés aux données en mauvais état. PLS réduit le nombre de prédicteurs en extrayant les composantes non corrélées basées sur la covariance entre le prédicteur et les variables de réponse. PLS est semblable à la régression des composantes principales et à la régression ridge, mais sa méthode de calcul diffère.
L'algorithme PLS génère une séquence de modèles, où chaque modèle consécutif contient une composante supplémentaire. Les composantes sont calculées l'une après l'autre, en commençant par la matrice des valeurs X et Y normalisées. Les composantes suivantes sont calculées à partir de la matrice des valeurs résiduelles Y et X ; les itérations cessent lorsque le nombre maximal de composantes est atteint ou lorsque les valeurs résiduelles X deviennent la matrice zéro. Si le nombre de composantes est égal à celui des prédicteurs, le modèle PLS est identique au modèle de régression des moindres carrés. La validation croisée permet d'identifier le nombre de composantes minimisant l'erreur de prévision.
PLS effectue simultanément une décomposition sur les prédicteurs et les réponses. Après avoir déterminé le nombre de composantes et calculé les contributions, Minitab calcule les coefficients de régression pour chaque prédicteur. Pour plus d'informations détaillées sur PLS et NIPALS, reportez-vous à 234.
Calcule la capacité de prévision que possèdent les modèles potentiels pour vous aider à déterminer le nombre de composantes à conserver dans votre modèle. Quand les données contiennent plusieurs variables de réponse, Minitab valide les composantes de toutes les réponses simultanément.
Pour chaque modèle potentiel, Minitab effectue les opérations suivantes :
Après avoir effectué les étapes 1 à 5 pour chaque modèle, Minitab sélectionne le modèle dans lequel le nombre de composantes produit la valeur de R2 prévu la plus élevée et la valeur de somme des carrés des erreurs de prévision la plus basse. Avec plusieurs variables de réponse, Minitab sélectionne le modèle avec la valeur de R2 prévu moyenne la plus élevée et la valeur de somme des carrés des erreurs de prévision moyenne la plus faible.