교차 검증을 사용한 부분 최소 제곱법

한 포도주 생산자가 포도주의 화학적 구성과 미각적 평가 사이의 관계를 확인하려고 합니다. 37개의 피노 누아 표본으로 17가지 성분인 Cd, Mo, Mn, Ni, Cu, Al, Ba, Cr, Sr, Pb, B, Mg, Si, Na, Ca, P, K의 농도를 측정하고 감정단이 포도주 향에 대해 점수를 매겼습니다. 포도주 생산자는 17가지 성분으로 향에 대한 점수를 예측하려고 합니다. 데이터 출처: I.E. Frank and B.R. Kowalski (1984). "Prediction of Wine Quality and Geographic Origin from Chemical Measurements by Partial Least-Squares Regression Modeling," Analytica Chimica Acta, 162, 241 − 251.

포도주 생산자는 모든 농도 및 카드뮴(Cd)이 포함된 모든 이원 교호작용을 모형에 포함하려고 합니다. 표본 대 예측 변수의 비율이 낮기 때문에 포도주 생산자는 부분 최소 제곱 회귀 분석을 사용하기로 결정합니다.

  1. 표본 데이터포도주향.MTW을 엽니다.
  2. 통계분석 > 회귀 분석 > 부분 최소 제곱을 선택합니다.
  3. 반응을 입력합니다.
  4. 모형Cd-K Cd*Mo Cd*Mn Cd*Ni Cd*Cu Cd*Al Cd*Ba Cd*Cr Cd*Sr Cd*Pb Cd*B Cd*Mg Cd*Si Cd*Na Cd*Ca Cd*P Cd*K을 입력합니다.
  5. 옵션을 클릭합니다.
  6. 교차 검증에서 단일 관측치 제거법을 선택합니다. 확인을 클릭합니다.
  7. 그래프을 클릭합니다. 모형 선택 그림을 선택합니다. 반응도계수도을 선택 취소합니다.
  8. 각 대화 상자에서 확인을 클릭합니다.

결과 해석

모형 선택 그림은 4-성분 모형의 예측 R2 값이 가장 크기 때문에 성분 4개인 모형을 최적 모형으로 표시합니다. 그림의 예측 R2 값은 교차 검증을 사용하여 계산합니다. 모형 선택 및 검증표에는 최적 모형에 대한 예측 R2 값이 약 0.56인 것으로 나와 있습니다. Minitab에서는 분산 계산 분석에 최적 모형을 사용합니다. 최적 모형은 0.05 신뢰 수준에서 p-값이 약 0.000이기 때문에 통계적으로 가장 유의합니다.

PLS 회귀: 향 대 Cd, Mo, Mn, Ni, Cu, Al, Ba, Cr, Sr, Pb, B, Mg, Si, Na, Ca, P, K

방법 교차 검증 단일 관측치 제거법 계산할 성분 설정 평가된 성분 수 10 선택된 성분 수 4
향에 대한 분산 분석 출처 DF SS MS F P 회귀 4 34.5514 8.63784 41.55 0.000 잔차 오차 32 6.6519 0.20787 총계 36 41.2032
향에 대한 모형 선택 및 검증 성분 X 분산 오차 R-제곱 PRESS R-제곱(예측) 1 0.158849 14.9389 0.637435 23.3439 0.433444 2 0.442267 12.2966 0.701564 21.0936 0.488060 3 0.522977 7.9761 0.806420 19.6136 0.523978 4 0.594546 6.6519 0.838559 18.1683 0.559056 5 5.8530 0.857948 19.2675 0.532379 6 5.0123 0.878352 22.3739 0.456988 7 4.3109 0.895374 24.0041 0.417421 8 4.0866 0.900818 24.7736 0.398747 9 3.5886 0.912904 24.9090 0.395460 10 3.2750 0.920516 24.8293 0.397395
이 사이트를 사용하면 분석 및 사용자 개인 컨텐츠에 대한 쿠키 사용에 동의하는 것입니다.  당사의 개인정보 보호정책을 확인하십시오