Exemplo de Regressão de mínimos quadrados parciais com validação cruzada

Um produtor de vinho quer saber como a composição química do seu vinho está relacionada às avaliações sensoriais. Ele tem 37 amostras de Pinot Noir, cada uma descrita por 17 concentrações de elementos (Cd, Mo, Mn, Ni, Cu, Al, Ba, Cr, Sr, Pb, B, Mg, Si, Na, Ca, P, K) e uma pontuação sobre o aroma do vinho de um painel de juízes. Ele quer prever a pontuação do aroma com base nos 17 elementos. Os dados são de: I.E. Frank and B.R. Kowalski (1984). "Prediction of Wine Quality and Geographic Origin from Chemical Measurements by Partial Least-Squares Regression Modeling," Analytica Chimica Acta, 162, 241 − 251.

O produtor quer incluir todas as concentrações e todas as interações bilaterais que incluem cádmio (Cd) no modelo. Como a razão das amostras para preditoras é baixa, o produtor decide usar a regressão de mínimos quadrados parciais.

  1. Abra os dados das amostras AromaDeVinho.MTW.
  2. Selecione Estat > Regressão > Mínimos Quadrados Parciais.
  3. Em Respostas, insira Aroma.
  4. Em Modelo, insira Cd-K Cd*Mo Cd*Mn Cd*Ni Cd*Cu Cd*Al Cd*Ba Cd*Cr Cd*Sr Cd*Pb Cd*B Cd*Mg Cd*Si Cd*Na Cd*Ca Cd*P Cd*K.
  5. Clique em Opções.
  6. Em Validação Cruzada, selecione Excluir um. Clique em OK.
  7. Clique em Gráficos. Selecione Gráfico de seleção de modelo. Desmarque Gráfico de resposta e Gráfico de coeficiente.
  8. Clique em OK em cada caixa de diálogo.

Interpretar os resultados

O gráfico Seleção do modelo identifica o modelo com 4 componentes como o modelo ótimo porque o modelo de 4 componentes tem o mais alto valor R2 predito. Os valores R2 preditos no gráfico são calculados com validação cruzada. A seleção do modelo e a tabela de validação mostra que o valor R2 predito para o modelo ótimo é e aproximadamente 0,56. O Minitab usa o modelo ótimo para a análise dos cálculos da variância. O modelo ótimo é estatisticamente significativo no nível 0,05 de significância porque o valor-p é de aproximadamente 0,000.

Regressão MQP: Aroma versus Cd; Mo; Mn; Ni; Cu; Al; Ba; Cr; ...

Método Validação Cruzada Excluir um Componentes para avaliar Conjunto Número de componentes avaliados 10 Número de componentes selecionados 4
Análise de Variância para Aroma Fonte GL SQ QM F P Regressão 4 34,5514 8,63784 41,55 0,000 Erro de Resíduos 32 6,6519 0,20787 Total 36 41,2032
Seleção de Modelo e Validação para Aroma Componentes Variância X Erro R2 PRESQ R2 (pred) 1 0,158849 14,9389 0,637435 23,3439 0,433444 2 0,442267 12,2966 0,701564 21,0936 0,488060 3 0,522977 7,9761 0,806420 19,6136 0,523978 4 0,594546 6,6519 0,838559 18,1683 0,559056 5 5,8530 0,857948 19,2675 0,532379 6 5,0123 0,878352 22,3739 0,456988 7 4,3109 0,895374 24,0041 0,417421 8 4,0866 0,900818 24,7736 0,398747 9 3,5886 0,912904 24,9090 0,395460 10 3,2750 0,920516 24,8293 0,397395
Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado.  Leia nossa política