교차 검증을 사용한 부분 최소 제곱법

한 포도주 생산자가 포도주의 화학적 구성과 미각적 평가 사이의 관계를 확인하려고 합니다. 37개의 피노 누아 표본으로 17가지 성분인 Cd, Mo, Mn, Ni, Cu, Al, Ba, Cr, Sr, Pb, B, Mg, Si, Na, Ca, P, K의 농도를 측정하고 감정단이 포도주 향에 대해 점수를 매겼습니다. 그는 17가지 성분으로 향에 대한 점수를 예측하려고 합니다. 데이터 출처: I.E. Frank and B.R. Kowalski (1984). "Prediction of Wine Quality and Geographic Origin from Chemical Measurements by Partial Least-Squares Regression Modeling," Analytica Chimica Acta, 162, 241 − 251.

포도주 생산자는 모든 농도 및 카드뮴(Cd)이 포함된 모든 이원 교호작용을 모형에 포함하려고 합니다. 표본 대 예측 변수의 비율이 낮기 때문에 포도주 생산자는 부분 최소 제곱 회귀 분석을 사용하기로 결정합니다.

  1. 표본 데이터를 엽니다 포도주향.MTW.
  2. 통계분석 > 회귀 분석 > 부분 최소 제곱을 선택합니다.
  3. 반응을 입력합니다.
  4. 모형Cd-KCd*MoCd*MnCd*NiCd*CuCd*AlCd*BaCd*CrCd*SrCd*PbCd*BCd*MgCd*SiCd*NaCd*CaCd*PCd*K을 입력합니다.
  5. 옵션을(를) 클릭합니다.
  6. 교차 검증 아래에서 단일 관측치 제거법을 선택합니다. 확인을(를) 클릭합니다.
  7. 그래프을(를) 클릭합니다. 모형 선택 그림을 선택합니다. 반응도계수도을 선택 취소합니다.
  8. 각 대화 상자에서 확인을 클릭합니다.

결과 해석

모형 선택 그림은 4-성분 모형의 예측 R2 값이 가장 크기 때문에 성분 4개인 모형을 최적 모형으로 표시합니다. 그림의 예측 R2 값은 교차 검증을 사용하여 계산합니다. 모형 선택 및 검증표에는 최적 모형에 대한 예측 R2 값이 약 0.56인 것으로 나와 있습니다. Minitab에서는 분산 계산 분석에 최적 모형을 사용합니다. 최적 모형은 0.05 신뢰 수준에서 p-값이 약 0.000이기 때문에 통계적으로 가장 유의합니다.

방법

교차 검증단일 관측치 제거법
계산할 성분설정
평가된 성분 수10
선택된 성분 수4

향에 대한 분산 분석

출처DFSSMSFP
회귀434.55148.6378441.550.000
잔차 오차326.65190.20787   
총계3641.2032     

향에 대한 모형 선택 및 검증

성분X 분산오차R-제곱PRESSR-제곱(예측)
10.15884914.93890.63743523.34390.433444
20.44226712.29660.70156421.09360.488060
30.5229777.97610.80642019.61360.523978
40.5945466.65190.83855918.16830.559056
5  5.85300.85794819.26750.532379
6  5.01230.87835222.37390.456988
7  4.31090.89537424.00410.417421
8  4.08660.90081824.77360.398747
9  3.58860.91290424.90900.395460
10  3.27500.92051624.82930.397395