Exemple de Régression par les moindres carrés partiels avec un fichier de données de test

Un scientifique travaillant dans un laboratoire de chimie alimentaire analyse 60 échantillons de farine de soja. Pour chaque échantillon, le scientifique détermine les quantités d'humidité et de lipides et relève des données spectrales NIR pour 88 longueurs d'onde. Le scientifique sélectionne de manière aléatoire 54 des 60 échantillons et estime la relation entre les réponses (humidité et lipides) et les prédicteurs (les 88 longueurs d'onde) à l'aide de la régression PLS. Le scientifique utilise les six échantillons restants comme ensemble de données de test afin d'évaluer la capacité de prévision du modèle.

  1. Ouvrez le fichier de données échantillons, FarineSoja.MTW.
  2. Sélectionnez .Stat > Régression > PLS (Moindres carrés partiels)
  3. Dans la zone Réponses, saisissez HumiditéLipides.
  4. Dans la zone Modèle, saisissez '1'-'88'.
  5. Cliquez sur Prévision.
  6. Dans la zone Nouvelle observation pour les prédicteurs continus, saisissez Test1-Test88.
  7. Dans la zone Nouvelle observation pour les réponses (facultatif), saisissez Humidité2Lipides2.
  8. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Les valeurs de p pour les deux réponses sont d'environ 0,000, ce qui est inférieur au seuil de signification de 0,05. Ces résultats indiquent qu'au moins un coefficient du modèle est différent de zéro. Le R2 de test pour l'humidité est d'environ 0,9. Le R2 de test pour les lipides est presque de 0,8. Les statistiques de R2 de test indiquent que les prévisions du modèle sont correctes. L'analyse individuelle de chaque réponse produit des résultats différents.

Méthode

Validation croiséeAucun
Composantes à calculerDéfinir
Nombre de composantes calculées10

Analyse de la variance pour Humidité

SourceDLSomme des
carrés
CMFP
Régression10468,51646,851661,460,000
Erreur résiduelle4332,7770,7623   
Total53501,293     

Analyse de la variance pour Lipides

SourceDLSomme des
carrés
CMFP
Régression10266,37826,637836,890,000
Erreur résiduelle4331,0500,7221   
Total53297,428     

Sélection et validation de modèle pour Humidité

ComposantesVariance XErreurR carré
10,98497696,92880,806643
20,99640088,99000,822479
30,99775771,93040,856510
40,99942758,31740,883666
50,99972258,12610,884048
60,99985348,52360,903203
70,99996345,98240,908272
80,99997633,15450,933862
90,99998232,80740,934554
100,99998632,77730,934615

Sélection et validation de modèle pour Lipides

ComposantesVariance XErreurR carré
10,984976282,5190,050127
20,996400229,9640,226824
30,997757115,9510,610155
40,99942798,2850,669550
50,99972257,9940,805015
60,99985353,0970,821480
70,99996352,0100,825133
80,99997648,8420,835784
90,99998234,3440,884529
100,99998631,0500,895604

Réponse prévue pour les nouvelles observations avec le modèle pour Humidité

LigneValeur
ajustée
ErT ajustIC à 95 %IP à 95 %
114,51840,388841(13,7343; 15,3026)(12,5910; 16,4459)
29,30490,372712(8,5532; 10,0565)(7,3904; 11,2193)
314,17900,504606(13,1614; 15,1966)(12,1454; 16,2127)
416,44770,559704(15,3189; 17,5764)(14,3562; 18,5391)
515,18720,358044(14,4652; 15,9093)(13,2842; 17,0903)
69,46390,485613(8,4846; 10,4433)(7,4492; 11,4787)
R carré du test : 0,906451

Réponse prévue pour les nouvelles observations avec le modèle pour Lipides

LigneValeur
ajustée
ErT ajustIC à 95 %IP à 95 %
118,73720,378459(17,9740; 19,5004)(16,8612; 20,6132)
215,37820,362762(14,6466; 16,1098)(13,5149; 17,2415)
320,78380,491134(19,7933; 21,7743)(18,8044; 22,7632)
414,36840,544761(13,2698; 15,4670)(12,3328; 16,4040)
516,60160,348485(15,8988; 17,3044)(14,7494; 18,4538)
620,74710,472648(19,7939; 21,7003)(18,7861; 22,7080)
R carré du test : 0,762701