Spécifiez la méthode de validation pour Ajuster le modèle de régression et Regressão Linear

Stat > Régression > Régression > Ajuster le modèle de régression > Validation

Module d'analyse prédictive > Régression linéaire > Validation

Choisissez la méthode de validation pour tester votre modèle. Habituellement, avec des échantillons plus petits, la méthode de validation croisée K-fold est appropriée. Avec des échantillons plus volumineux, vous pouvez sélectionner une fraction des cas à utiliser pour la formation et les tests.

Validation croisée sur K ensembles

Procédez comme suit pour utiliser la validation croisée K-fold.

  1. Dans la liste déroulante, sélectionnez Validation croisée sur K ensembles.
  2. Choisissez l’une des options suivantes pour spécifier si vous souhaitez attribuer des plis de manière aléatoire ou avec une colonne d’ID.
    • Affecter aléatoirement des lignes de chaque partition: Sélectionnez cette option pour que Minitab sélectionne au hasard des lignes pour chaque pli. Vous pouvez spécifier le nombre de plis. La valeur par défaut de 10 fonctionne bien dans la plupart des cas. L’utilisation d’une valeur inférieure à K peut introduire plus de biais ; cependant, des valeurs plus élevées de K peuvent introduire une plus grande variabilité. Vous pouvez également définir une base pour le générateur de nombres aléatoires.
    • Affecter des lignes de chaque partition par colonne d'ID: Sélectionnez cette option pour choisir les rangées à inclure dans chaque pli. Dans Colonne d'ID, entrez la colonne qui identifie les plis. Chaque ligne avec la même valeur dans la colonne ID se trouve dans le même pli.
  3. (Facultatif) Cochez cette case Stocker la colonne d'ID pour la validation croisée sur K partitions pour enregistrer la colonne ID.

Validation avec un ensemble de test

Procédez comme suit pour diviser les données en un ensemble de données d’entraînement et un ensemble de données de test.

  1. Dans la liste déroulante, sélectionnez Validation avec un ensemble de test.
  2. Choisissez l’une des options suivantes pour spécifier si vous souhaitez sélectionner une fraction de lignes de manière aléatoire ou avec une colonne d’ID.
    • Sélectionner aléatoirement une fraction de lignes comme ensemble de test: Sélectionnez cette option pour que Minitab sélectionne aléatoirement l’ensemble de données de test. Vous pouvez spécifier la quantité de données à utiliser dans l’ensemble de données de test. La valeur par défaut de 0,3 fonctionne bien dans la plupart des cas. Vous souhaitez inclure suffisamment de données dans l’ensemble de données de test pour bien évaluer le modèle. Si vous n’êtes pas sûr de la forme du modèle, un ensemble de données de test plus important fournit une validation plus forte. Vous souhaitez également que l’ensemble de données d’entraînement contienne suffisamment de données pour estimer correctement le modèle. En règle générale, les modèles avec plus de prédicteurs nécessitent plus de données d’entraînement pour être estimés.
    • Définir la division d'apprentissage/de test par colonne d'ID: Sélectionnez cette option pour sélectionner vous-même les lignes à inclure dans l’échantillon de test. Dans Colonne d'ID, entrez la colonne qui indique les lignes à utiliser pour l’échantillon de test. La colonne ID ne doit contenir que 2 valeurs. Dans Niveau pour l'ensemble de test, sélectionnez le niveau à utiliser comme échantillon de test.
  3. (Facultatif) Cochez cette case Stocker la colonne d'ID pour la division d'apprentissage/de test pour enregistrer la colonne ID.

Aucune

Si Aucune cette option est sélectionnée, aucune validation supplémentaire n’est effectuée.