Exemple de PLS (moindres carrés partiels) avec un fichier de données de test

Un scientifique travaillant dans un laboratoire de chimie alimentaire analyse 60 échantillons de farine de soja. Pour chaque échantillon, le scientifique détermine les quantités d'humidité et de lipides et relève des données spectrales NIR pour 88 longueurs d'onde. Le scientifique sélectionne de manière aléatoire 54 des 60 échantillons et estime la relation entre les réponses (humidité et lipides) et les prédicteurs (les 88 longueurs d'onde) à l'aide de la régression PLS. Le scientifique utilise les six échantillons restants comme ensemble de données de test afin d'évaluer la capacité de prévision du modèle.

  1. Ouvrez le fichier de données échantillons, FarineSoja.MTW.
  2. Sélectionnez Stat > Régression > PLS (Moindres carrés partiels).
  3. Dans la zone Réponses, saisissez Humidité Lipides.
  4. Dans la zone Modèle, saisissez '1'-'88'.
  5. Cliquez sur Prévision.
  6. Dans la zone Nouvelle observation pour les prédicteurs continus, saisissez Test1-Test88.
  7. Dans la zone Nouvelle observation pour les réponses (facultatif), saisissez Humidité2 Lipides2.
  8. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Les valeurs de p pour les deux réponses sont d'environ 0,000, ce qui est inférieur au seuil de signification de 0,05. Ces résultats indiquent qu'au moins un coefficient du modèle est différent de zéro. Le R2 de test pour l'humidité est d'environ 0,9. Le R2 de test pour les lipides est presque de 0,8. Les statistiques de R2 de test indiquent que les prévisions du modèle sont correctes. L'analyse individuelle de chaque réponse produit des résultats différents.

Régression PLS (moindres carrés partiels) : Humidité; Lipides en fonction de 1;

Méthode Validation croisée Aucun Composantes à calculer Définir Nombre de composantes calculées 10
Analyse de la variance pour Humidité Somme des Source DL carrés CM F P Régression 10 468,516 46,8516 61,46 0,000 Erreur résiduelle 43 32,777 0,7623 Total 53 501,293
Analyse de la variance pour Lipides Somme des Source DL carrés CM F P Régression 10 266,378 26,6378 36,89 0,000 Erreur résiduelle 43 31,050 0,7221 Total 53 297,428
Sélection et validation de modèle pour Humidité Composantes Variance X Erreur R carré 1 0,984976 96,9288 0,806643 2 0,996400 88,9900 0,822479 3 0,997757 71,9304 0,856510 4 0,999427 58,3174 0,883666 5 0,999722 58,1261 0,884048 6 0,999853 48,5236 0,903203 7 0,999963 45,9824 0,908272 8 0,999976 33,1545 0,933862 9 0,999982 32,8074 0,934554 10 0,999986 32,7773 0,934615
Sélection et validation de modèle pour Lipides Composantes Variance X Erreur R carré 1 0,984976 282,519 0,050127 2 0,996400 229,964 0,226824 3 0,997757 115,951 0,610155 4 0,999427 98,285 0,669550 5 0,999722 57,994 0,805015 6 0,999853 53,097 0,821480 7 0,999963 52,010 0,825133 8 0,999976 48,842 0,835784 9 0,999982 34,344 0,884529 10 0,999986 31,050 0,895604
Réponse prévue pour les nouvelles observations avec le modèle pour Humidité Valeur Ligne ajustée ErT ajust IC à 95 % IP à 95 % 1 14,5184 0,388841 (13,7343; 15,3026) (12,5910; 16,4459) 2 9,3049 0,372712 ( 8,5532; 10,0565) ( 7,3904; 11,2193) 3 14,1790 0,504606 (13,1614; 15,1966) (12,1454; 16,2127) 4 16,4477 0,559704 (15,3189; 17,5764) (14,3562; 18,5391) 5 15,1872 0,358044 (14,4652; 15,9093) (13,2842; 17,0903) 6 9,4639 0,485613 ( 8,4846; 10,4433) ( 7,4492; 11,4787) R carré du test : 0,906451
Réponse prévue pour les nouvelles observations avec le modèle pour Lipides Valeur Ligne ajustée ErT ajust IC à 95 % IP à 95 % 1 18,7372 0,378459 (17,9740; 19,5004) (16,8612; 20,6132) 2 15,3782 0,362762 (14,6466; 16,1098) (13,5149; 17,2415) 3 20,7838 0,491134 (19,7933; 21,7743) (18,8044; 22,7632) 4 14,3684 0,544761 (13,2698; 15,4670) (12,3328; 16,4040) 5 16,6016 0,348485 (15,8988; 17,3044) (14,7494; 18,4538) 6 20,7471 0,472648 (19,7939; 21,7003) (18,7861; 22,7080) R carré du test : 0,762701
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique