Spécifier la méthode de validation pour Ajuster le modèle de régression

Stat > Régression > Régression > Ajuster le modèle de régression > Validation

Choisissez la méthode de validation pour tester votre modèle. Habituellement, avec des échantillons plus petits, la méthode de validation croisée de K ensembles est appropriée. Avec des échantillons plus grands, vous pouvez sélectionner une fraction de cas à utiliser pour l'apprentissage et les tests.

Validation croisée K-ensemble(s)

Procédez comme suit pour utiliser la validation croisée de K ensembles.

  1. Dans la liste déroulante, sélectionnez Validation croisée K-ensemble(s).
  2. Choisissez l'une des options suivantes pour spécifier si vous souhaitez attribuer des ensembles de manière aléatoire ou avec une colonne d'ID.
    • Assigner des lignes de chaque ensemble de maniére aléatorie : sélectionnez cette option afin que Minitab sélectionne de manière aléatoire des lignes pour chaque ensemble. Vous pouvez spécifier le nombre d'ensembles. La valeur par défaut (10) fonctionne bien dans la plupart des cas. L'utilisation d'une valeur inférieure de K peut introduire plus de biais. Cependant, de plus grandes valeurs de K peuvent introduire plus de variabilité. Vous pouvez également définir une base pour le générateur de nombres aléatoires.
    • Assigner des lignes de chaque ensemble par la colonne de ID : sélectionnez cette option pour choisir les lignes à inclure dans chaque ensemble. Dans Colonne de ID, saisissez la colonne qui identifie les ensembles. Chaque ligne ayant la même valeur dans la colonne d'ID se trouve dans le même ensemble.
  3. (Facultatif) Cochez Stocker la colonne de ID pour la validation corisée de K-ensemble(s) pour enregistrer la colonne d'ID.

Validation avec un ensemble de test

Procédez comme suit pour diviser les données en un ensemble de données d'apprentissage et un ensemble de données de test.

  1. Dans la liste déroulante, sélectionnez Validation avec un ensemble de test.
  2. Choisissez l'une des options suivantes pour spécifier si vous souhaitez sélectionner une fraction de lignes de manière aléatoire ou avec une colonne d'ID.
    • Sélectionnez une fraction de linges comme ensemble de test de maniére aléatoire : sélectionnez cette option afin que Minitab sélectionne de manière aléatoire l'ensemble de données de test. Vous pouvez spécifier la quantité de données à utiliser dans l'ensemble de données de test. La valeur par défaut (0,3) fonctionne bien dans la plupart des cas. Vous souhaitez inclure suffisamment de données dans l'ensemble de données de test pour bien évaluer le modèle. Si vous n'êtes pas sûr de la forme du modèle, un ensemble de données de test plus grand permet une validation plus solide. Vous souhaitez également disposer de suffisamment de données dans l'ensemble de données d'apprentissage pour bien estimer le modèle. Généralement, les modèles avec plus de prédicteurs nécessitent plus de données d'apprentissage pour l'estimation.
    • Définir la division de formation/test par la colonne de ID : sélectionnez cette option pour choisir vous-même les lignes à inclure dans l'échantillon de test. Dans Colonne de ID, saisissez la colonne qui indique les lignes à utiliser pour l'échantillon de test. La colonne d'ID ne doit contenir que deux valeurs. Dans Niveau pour l’ensemble de test, sélectionnez le niveau à utiliser comme échantillon de test.
  3. (Facultatif) Cochez Stocker la colonne ID pour la division de formation/test pour enregistrer la colonne d'ID.

Aucun

Si Aucun est sélectionné, aucune validation supplémentaire n'est effectuée.
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique