Sélectionner les options de l'analyse pour la fonction Régression par les moindres carrés partiels

Stat > Régression > PLS (Moindres carrés partiels) > Options
Validation croisée

La validation croisée calcule la capacité de prévision que possèdent les modèles potentiels pour vous aider à déterminer le nombre de composantes à conserver dans votre modèle. Utilisez la validation croisée afin de déterminer le nombre optimal de composantes pour vos données. Si les données contiennent plusieurs variables de réponse, Minitab valide les composantes de toutes les réponses simultanément. Pour plus d'informations, reportez-vous à la rubrique Validation croisée dans la PLS.

Minitab peut utiliser trois méthodes différentes pour la validation croisée :
  • Aucune : option permettant de ne pas effectuer de validation croisée.
  • Omettre une validation : option permettant de calculer les modèles potentiels en omettant une observation à la fois. Pour les grands ensembles de données, cette méthode peut prendre beaucoup de temps car elle recalcule les modèles autant de fois qu'il y a d'observations.
  • Omettre un groupe de cette taille : indiquez le nombre d'observations à exclure chaque fois que le modèle est recalculé. Etant donné que cette méthode réduit le nombre de fois qu'un modèle doit être recalculé, elle est plus appropriée pour les grands fichiers de données.
  • Omettre comme indiqué dans la colonne : option permettant de calculer les modèles en excluant simultanément les observations portant le même numéro dans la colonne d'identificateur de groupe. Cette méthode permet de préciser les observations omises en même temps. Par exemple, si la colonne des identificateurs de groupes comprend les chiffres 1, 2 et 3, toutes les observations qui comprennent le chiffre 1 sont omises ensemble et le modèle est recalculé. Ensuite, toutes les observations comprenant le chiffre 2 sont omises, et ainsi de suite.
Type de codage pour les prédicteurs de catégorie
Pour effectuer l'analyse, Minitab a besoin de recoder les prédicteurs de catégorie à l'aide de l'une des deux méthodes disponibles. Choisissez une méthode selon que vous voulez comparer les niveaux des prédicteurs à la moyenne globale ou à la moyenne d'un niveau de référence. Pour plus d'informations, reportez-vous à la rubrique Schémas de codage des prédicteurs de catégorie.
  • (1, 0) : choisissez cette option pour estimer la différence entre chaque moyenne de niveau et la moyenne du niveau de référence. Si vous sélectionnez le schéma de codage (1, 0), vous pouvez spécifier le niveau de référence.
  • (-1, 0, +1) : choisissez cette option pour estimer la différence entre chaque moyenne de niveau et la moyenne globale.
Niveau de référence (entrez le prédicteur de catégorie suivi du niveau)
Indiquez le niveau de référence en saisissant la colonne des prédicteurs de catégorie, puis le niveau de référence. (Les niveaux de texte et de date/heure doivent être placés entre guillemets.) Vous pouvez attribuer un niveau de référence uniquement lorsque vous utilisez le codage 1, 0. Par défaut, Minitab définit les niveaux de référence suivants en fonction du type de données :
  • Pour les prédicteurs de catégorie numériques, le niveau de référence est celui ayant la plus faible valeur numérique.
  • Pour les prédicteurs de catégorie de type date/heure, le niveau de référence est celui avec le date et l'heure les plus anciennes.
  • Pour les prédicteurs de catégorie de type texte, le niveau de référence est le premier dans l'ordre alphabétique.