検定データセットを持つ偏最小二乗回帰の例

食品化学の実験室の科学者が、60個の大豆粉のサンプルを分析します。各サンプルの水分と脂肪分を調べ、88波長で近赤外線(NIR)スペクトルデータを記録します。科学者は60サンプルからランダムに54サンプルを選択し、PLS回帰を使用して応答変数(水分と脂肪分)と予測変数(88 NIR波長)との関係を推定します。残りの残り6つのサンプルは、モデルの予測能力を評価するために検定のデータセットとして使用します。

  1. 標本データを開く、 大豆粉.MTW.
  2. 統計 > 回帰 > PLS を選択します。
  3. 応答に、水分脂肪を入力します。
  4. モデル'1'-'88'を入力します。
  5. 予測をクリックします。
  6. 連続予測変数の新しい観測値に、テスト1-テスト88を入力します。
  7. 応答の新しい観測値(オプション)に、水分2脂肪2を入力します。
  8. 各ダイアログボックスでOKをクリックします。

結果を解釈する

両方の回帰のp値はおよそ0.000であり、有意水準の0.05未満です。これらの結果は、モデル内の少なくとも1つの係数がゼロではないことを示しています。湿度の検定R2の値はおよそ0.9です。脂肪分の検定R2の値はほぼ0.8です。検定R2統計量はモデルが十分に予測できていることを示します。各応答の分析はそれぞれ異なる結果になります。

方法

交差検証なし
計算する成分設定
計算された成分数10

水分の分散分析

要因自由度平方和平均平方F値p値
回帰10468.51646.851661.460.000
残差誤差4332.7770.7623   
合計53501.293     

脂肪の分散分析

要因自由度平方和平均平方F値p値
回帰10266.37826.637836.890.000
残差誤差4331.0500.7221   
合計53297.428     

水分に対するモデル選択および検証

成分X分散誤差R二乗
10.98497696.92880.806643
20.99640088.99000.822479
30.99775771.93040.856510
40.99942758.31740.883666
50.99972258.12610.884048
60.99985348.52360.903203
70.99996345.98240.908272
80.99997633.15450.933862
90.99998232.80740.934554
100.99998632.77730.934615

脂肪に対するモデル選択および検証

成分X分散誤差R二乗
10.984976282.5190.050127
20.996400229.9640.226824
30.997757115.9510.610155
40.99942798.2850.669550
50.99972257.9940.805015
60.99985353.0970.821480
70.99996352.0100.825133
80.99997648.8420.835784
90.99998234.3440.884529
100.99998631.0500.895604

水分に対するモデルを使用する新しい観測値に対する予測応答

適合値適合値の標準誤差95%信頼区間95%予測区間
114.51840.388841(13.7343, 15.3026)(12.5910, 16.4459)
29.30490.372712(8.5532, 10.0565)(7.3904, 11.2193)
314.17900.504606(13.1614, 15.1966)(12.1454, 16.2127)
416.44770.559704(15.3189, 17.5764)(14.3562, 18.5391)
515.18720.358044(14.4652, 15.9093)(13.2842, 17.0903)
69.46390.485613(8.4846, 10.4433)(7.4492, 11.4787)
テストR二乗: 0.906451

脂肪に対するモデルを使用する新しい観測値に対する予測応答

適合値適合値の標準誤差95%信頼区間95%予測区間
118.73720.378459(17.9740, 19.5004)(16.8612, 20.6132)
215.37820.362762(14.6466, 16.1098)(13.5149, 17.2415)
320.78380.491134(19.7933, 21.7743)(18.8044, 22.7632)
414.36840.544761(13.2698, 15.4670)(12.3328, 16.4040)
516.60160.348485(15.8988, 17.3044)(14.7494, 18.4538)
620.74710.472648(19.7939, 21.7003)(18.7861, 22.7080)
テストR二乗: 0.762701