검정 데이터 집합을 사용한 부분 최소 제곱법

한 식품화학 연구소의 과학자가 콩가루 표본 60개를 분석합니다. 각 표본에 대해 과학자는 수분과 지방 함유량을 확인하고 88개 파장에서 근적외선(NIR) 분광 데이터를 기록합니다. 과학자는 60개 표본 중 54개를 랜덤하게 선택하고 PLS 회귀 분석을 사용하여 반응 변수(수분과 지방)와 예측 변수(88 NIR 파장) 간의 관계를 추정합니다. 나머지 표본 6개를 검정 데이터 집합으로 사용하여 모형의 예측 능력을 평가합니다.

  1. 표본 데이터를 엽니다 콩가루.MTW.
  2. 통계분석 > 회귀 분석 > 부분 최소 제곱을 선택합니다.
  3. 반응수분지방을 입력합니다.
  4. 모형'1'-'88'을 입력합니다.
  5. 예측을(를) 클릭합니다.
  6. 계량형 예측 변수에 대한 새 관측치검정1-검정88을 입력합니다.
  7. 반응에 대한 새 관측치(옵션)수분2지방2을 입력합니다.
  8. 각 대화 상자에서 확인을 클릭합니다.

결과 해석

두 반응값에 대한 p-값은 모두 약 0.000으로, 유의 수준인 0.05보다 작습니다. 이 결과는 모형의 계수 중 하나 이상이 0과 다름을 나타냅니다. 습기에 대한 검정 R2은 약 0.9입니다. 지방에 대한 검정 R2 값은 거의 0.8입니다. 검정 R2 통계량은 모델의 예측 능력이 우수함을 나타냅니다. 각 반응값의 개별 분석에서는 서로 다른 결과가 나타납니다.

방법

교차 검증없음
계산할 성분설정
계산된 성분 수10

수분에 대한 분산 분석

출처DFSSMSFP
회귀10468.51646.851661.460.000
잔차 오차4332.7770.7623   
총계53501.293     

지방에 대한 분산 분석

출처DFSSMSFP
회귀10266.37826.637836.890.000
잔차 오차4331.0500.7221   
총계53297.428     

수분에 대한 모형 선택 및 검증

성분X 분산오차R-제곱
10.98497696.92880.806643
20.99640088.99000.822479
30.99775771.93040.856510
40.99942758.31740.883666
50.99972258.12610.884048
60.99985348.52360.903203
70.99996345.98240.908272
80.99997633.15450.933862
90.99998232.80740.934554
100.99998632.77730.934615

지방에 대한 모형 선택 및 검증

성분X 분산오차R-제곱
10.984976282.5190.050127
20.996400229.9640.226824
30.997757115.9510.610155
40.99942798.2850.669550
50.99972257.9940.805015
60.99985353.0970.821480
70.99996352.0100.825133
80.99997648.8420.835784
90.99998234.3440.884529
100.99998631.0500.895604

수분에 대한 모델을 사용한 새로운 관측치에 대한 예측 반응

적합치SE 적합치95% CI95% PI
114.51840.388841(13.7343, 15.3026)(12.5910, 16.4459)
29.30490.372712(8.5532, 10.0565)(7.3904, 11.2193)
314.17900.504606(13.1614, 15.1966)(12.1454, 16.2127)
416.44770.559704(15.3189, 17.5764)(14.3562, 18.5391)
515.18720.358044(14.4652, 15.9093)(13.2842, 17.0903)
69.46390.485613(8.4846, 10.4433)(7.4492, 11.4787)
R-제곱 검정: 0.906451

지방에 대한 모델을 사용한 새로운 관측치에 대한 예측 반응

적합치SE 적합치95% CI95% PI
118.73720.378459(17.9740, 19.5004)(16.8612, 20.6132)
215.37820.362762(14.6466, 16.1098)(13.5149, 17.2415)
320.78380.491134(19.7933, 21.7743)(18.8044, 22.7632)
414.36840.544761(13.2698, 15.4670)(12.3328, 16.4040)
516.60160.348485(15.8988, 17.3044)(14.7494, 18.4538)
620.74710.472648(19.7939, 21.7003)(18.7861, 22.7080)
R-제곱 검정: 0.762701