Exemplo de Regressão de mínimos quadrados parciais com um conjunto de dados de teste

Um cientista em um laboratório de química de alimentos analisa 60 amostras de farinha de soja. Para cada amostra, o cientista determina o teor de umidade e gordura, e os registram dados espectrais quase infravermelhos (NIR) em 88 comprimentos de onda. O cientista seleciona aleatoriamente 54 das 60 amostras e calcula a relação entre as respostas (umidade e gordura) e os preditores (88 comprimentos de onda NIR), utilizando regressão PLS. O cientista usa as 6 amostras restantes como conjunto de dados de teste para avaliar a capacidade preditiva do modelo.

  1. Abra os dados amostrais, FarinhaDeSoja.MTW.
  2. Selecione Estat > Regressão > Mínimos quadrados parciais.
  3. Em Respostas, insira UmidadeGordura.
  4. Em Modelo, insira '1'-'88'.
  5. Clique em Predição.
  6. Em Nova observação para preditores contínuos, insira Teste1-Teste88.
  7. Em Nova observação para respostas (opcional), insira Umidade2Gordura2.
  8. Clique em OK em cada caixa de diálogo.

Interpretar os resultados

Os valores-p para ambas as respostas são aproximadamente 0,000, que são menos do que o nível de significância de 0,05. Esses resultados indicam que pelo menos um coeficiente no modelo é diferente de zero. O valor de R2 de teste para umidade é de aproximadamente 0,9. O valor de R2 do teste é de quase 0,8. As estatísticas de R2 do teste indicam que os modelos predizem bem. A análise de cada resposta individualmente iria fornecer resultados diferentes.

Método

Validação CruzadaNenhum
Componentes para calcular.Conjunto
Número de componentes calculados10

Análise de Variância para Umidade

FonteGLSQQMFP
Regressão10468,51646,851661,460,000
Erro de Resíduos4332,7770,7623   
Total53501,293     

Análise de Variância para Gordura

FonteGLSQQMFP
Regressão10266,37826,637836,890,000
Erro de Resíduos4331,0500,7221   
Total53297,428     

Seleção de Modelo e Validação para Umidade

ComponentesVariância XErroR-quad.
10,98497696,92880,806643
20,99640088,99000,822479
30,99775771,93040,856510
40,99942758,31740,883666
50,99972258,12610,884048
60,99985348,52360,903203
70,99996345,98240,908272
80,99997633,15450,933862
90,99998232,80740,934554
100,99998632,77730,934615

Seleção de Modelo e Validação para Gordura

ComponentesVariância XErroR-quad.
10,984976282,5190,050127
20,996400229,9640,226824
30,997757115,9510,610155
40,99942798,2850,669550
50,99972257,9940,805015
60,99985353,0970,821480
70,99996352,0100,825133
80,99997648,8420,835784
90,99998234,3440,884529
100,99998631,0500,895604

Resposta Predita para Novas Observações Usando o Modelo para Umidade

LinhaAjusteEP do
Ajustado
IC de 95%IP de 95%
114,51840,388841(13,7343; 15,3026)(12,5910; 16,4459)
29,30490,372712(8,5532; 10,0565)(7,3904; 11,2193)
314,17900,504606(13,1614; 15,1966)(12,1454; 16,2127)
416,44770,559704(15,3189; 17,5764)(14,3562; 18,5391)
515,18720,358044(14,4652; 15,9093)(13,2842; 17,0903)
69,46390,485613(8,4846; 10,4433)(7,4492; 11,4787)
Teste R2: 0,906451

Resposta Predita para Novas Observações Usando o Modelo para Gordura

LinhaAjusteEP do
Ajustado
IC de 95%IP de 95%
118,73720,378459(17,9740; 19,5004)(16,8612; 20,6132)
215,37820,362762(14,6466; 16,1098)(13,5149; 17,2415)
320,78380,491134(19,7933; 21,7743)(18,8044; 22,7632)
414,36840,544761(13,2698; 15,4670)(12,3328; 16,4040)
516,60160,348485(15,8988; 17,3044)(14,7494; 18,4538)
620,74710,472648(19,7939; 21,7003)(18,7861; 22,7080)
Teste R2: 0,762701