Estatísticas x e y para Regressão de mínimos quadrados parciais

Encontre definições e orientações de interpretação para cada estatística na tabela Estatísticas x e y.

Valores-x calculados

Os valores-x calculados são combinações lineares dos escores-x. Os valores-x calculados contêm a variância nos termos explicados pelo modelo de regressão PLS. As observações com valores-x relativamente pequenos calculados são outliers no espaço-x e não são bem explicados pelo modelo.

A matriz-x calculada, similar à matriz-x original, é uma matriz n x p onde n = número de observações e p = número de termos. Os valores-x calculados estão na mesma escala que as preditoras.

Se o número de componentes for igual ao número de termos, o valor-x calculado será igual ao valor-x original.

Cargas fatoriais-x

As cargas fatoriais-y são coeficientes lineares que ligam as respostas aos escores-x. As cargas fatoriais-x indicam a importância do termo correspondente ao mésimo componente. As cargas fatoriais-x, que são similares a autovetores na análise dos componentes principais, formam uma matriz p x m, onde p= número de termos e m = número de componentes.

Resíduos X

Os resíduos-x contêm a variância nas preditoras não explicada pelo modelo de regressão PLS. As observações com resíduos-x relativamente grandes são outliers no espaço-x, indicando que eles não são bem explicados pelo modelo.

Os resíduos-x são as diferenças entre os valores reais de cada termo e os valores-x calculados, e estão na mesma escala das preditoras originais. A matriz-x residual, similar à matriz-x original, é uma matriz n x p onde n = número de observações e p = número de termos.

Escores-x

Os escores-x são combinações lineares dos termos do modelo. Os escores-x, que são similares aos escores do componente principal, formam uma matriz n x m de colunas não correlacionadas, onde n = número de observações e m = número de componentes. Os escores-x são projeções das observações sobre os componentes de regressão PLS. A regressão PLS se ajusta aos escores-x, que substituem os termos originais no modelo, usando a estimativa de mínimos quadrados.

Variância X

A variância é a quantidade de variância nos termos que são explicados pelo modelo. O valor-x da variância está entre 0 e 1.

Quanto mais perto o valor-x da variância estiver de 1, os componentes representam melhor o conjunto original de termos. Se você tiver mais de 1 resposta, o valor-x da variância é o mesmo para todas as respostas.

Pesos X

Os pesos-x descrevem a covariância entre as preditoras e as respostas. No algoritmo, os pesos-x são usados para assegurar que os escores-x sejam ortogonais ou não-relacionados a cada um. Os pesos-x, que são usados para calcular os escores-x, formam uma matriz p x m, onde p= número de termos e m = número de componentes.

Valores-y calculados

Os valores-y calculados são combinações lineares dos escores-x. Os valores-y calculados contêm a variância nas respostas explicadas pelo modelo de regressão PLS. As observações com valores-y relativamente pequenos calculados são outliers no espaço-y e não são bem explicados.

A matriz-y calculada, similar à matriz-y original, é uma matriz n x r onde n = número de observações e r = número de respostas. Os valores-y calculados estão na mesma escala das respostas.

Cargas fatoriais-y

As cargas fatoriais-y são coeficientes lineares que ligam as respostas aos escores-y. O valores de cargas fatoriais-y denotam a importância da resposta correspondente ao mésimo componente. As cargas fatoriais-y formam uma matriz r x m, onde r = número de respostas e m = número de componentes.

Resíduos-y

Os resíduos-y contêm a variância restante nas respostas não explicadas pelo modelo de regressão PLS. As observações com resíduos-y relativamente grandes são outliers no espaço-y, indicando que elas não são bem explicadas pelo modelo.

Os resíduos y são as diferenças entre os valores reais das respostas e os valores-y calculados, e estão na mesma escala das respostas originais. A matriz-y residual, similar à matriz-y original, é uma matriz n x r onde n = número de observações e r = número de respostas.

Escores-y

Os escores-y são combinações lineares das variáveis de resposta. Os escores-y formam uma matriz n x m, onde n = número de observações e m = número de componentes. Os escores-y são projeções das observações sobre os componentes de regressão PLS.