Satistiques X et Y pour Régression par les moindres carrés partiels

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie dans le tableau des statistiques X et Y.

Sur ce thème

Valeurs calculées X
Contributions X
Valeurs résiduelles X
Scores X
Variance X
Pondérations X
Valeurs calculées Y
Contributions Y
Valeurs résiduelles Y
Scores Y

Valeurs calculées X

Les valeurs calculées X sont des combinaisons linéaires des scores X. Elles contiennent la variance des termes expliquée par le modèle de régression PLS. Les observations avec des valeurs calculées X relativement faibles sont des valeurs aberrantes dans l'espace X et ne sont pas expliquées correctement par le modèle.

Semblable à la matrice X d'origine, la matrice des valeurs calculées X est une matrice n x p, dans laquelle n est le nombre d'observations et p le nombre de termes. Les valeurs calculées X se trouvent sur la même échelle que les prédicteurs.

S'il y a autant de composantes que de termes, la valeur calculée X est égale à la valeur X d'origine.

Contributions X

Les contributions X sont les coefficients linéaires liant les termes aux scores X. Elles indiquent l'importance du terme correspondant pour la m^e composante. Semblables aux vecteurs propres de l'analyse des composantes principales, les contributions X forment une matrice p x m, p étant le nombre de termes et m le nombre de composantes.

Valeurs résiduelles X

Les valeurs résiduelles X contiennent la variance des prédicteurs non expliquée par le modèle de régression PLS. Les observations avec des valeurs résiduelles X relativement importantes sont des valeurs aberrantes dans l'espace X, indiquant qu'elles ne sont pas expliquées correctement par le modèle.

Les valeurs résiduelles X représentent les différences entre les valeurs réelles de chaque terme et les valeurs calculées X ; leur échelle est identique à celle des prédicteurs d'origine. Semblable à la matrice X d'origine, la matrice des valeurs résiduelles X est une matrice n x p, dans laquelle n est le nombre d'observations et p le nombre de termes.

Scores X

Les scores X sont des combinaisons linéaires de termes dans le modèle. Semblables aux scores principaux de composantes, les scores X forment une matrice n x m de colonnes non corrélées, dans laquelle n est le nombre d'observations et m le nombre de composantes. Les scores X sont des projections des observations des composantes de la régression PLS. La régression PLS ajuste les scores X, qui remplacent les termes d'origine dans le modèle, suivant l'estimation des moindres carrés.

Variance X

La variance X indique l'importance de la variance des termes expliquée par le modèle. La valeur de la variance X est comprise entre 0 et 1.

Plus la valeur de la variance X est proche de 1, mieux les composantes représentent l'ensemble de termes d'origine. S'il existe plusieurs réponses, la variance X est la même pour toutes.

Pondérations X

Les pondérations X décrivent la covariance entre les prédicteurs et les réponses. Dans l'algorithme, les pondérations X permettent de faire en sorte que les scores X soient orthogonaux ou non liés les uns aux autres. Les pondérations X, qui permettent de calculer les scores X, forment une matrice p x m, où p représente le nombre de termes et m le nombre de composantes.

Valeurs calculées Y

Les valeurs calculées Y sont des combinaisons linéaires des scores X. Les valeurs calculées Y contiennent la variance des réponses expliquée par le modèle PLS. Les observations avec des valeurs calculées Y relativement faibles sont des valeurs aberrantes dans l'espace Y, et ne sont pas expliquées correctement.

Comme la matrice Y d'origine, la matrice des valeurs calculées Y est une matrice n x r, dans laquelle n est le nombre d'observations et r le nombre de réponses. Les valeurs calculées Y se trouvent sur la même échelle que les réponses.

Contributions Y

Les contributions Y sont des coefficients linéaires liant les réponses aux scores Y. Elles indiquent l'importance de la réponse correspondante pour la m^e composante. Les contributions Y forment une matrice r x m, dans laquelle r est le nombre de réponses et m le nombre de composantes.

Valeurs résiduelles Y

Les valeurs résiduelles Y contiennent la variance restante des réponses que n'explique pas le modèle PLS. Les observations avec des valeurs résiduelles Y relativement importantes sont des valeurs aberrantes dans l'espace Y, indiquant qu'elles ne sont pas expliquées correctement par le modèle.

Les valeurs résiduelles Y sont le résultat de la différence des valeurs de réponse réelles et des valeurs calculées à partir des scores Y ; leur échelle est identique à celle des réponses d'origine. Semblable à la matrice Y d'origine, la matrice des valeurs résiduelles Y est une matrice n x r, dans laquelle n est le nombre d'observations et r le nombre de réponses.

Scores Y

Les scores Y sont des combinaisons linéaires des variables de réponse. Les scores Y forment une matrice n x m, dans laquelle n est le nombre d'observations et m le nombre de composantes. Les scores Y sont des projections des observations des composantes de la régression PLS.