Procédez comme suit pour diviser les données en un ensemble de données d'apprentissage et un ensemble de données de test.
- Dans la liste déroulante, sélectionnez Validation avec un ensemble de test.
- Sélectionnez l'une des options suivantes pour spécifier si vous souhaitez sélectionner une fraction de lignes de manière aléatoire ou avec une colonne d'ID.
- Sélectionner aléatoirement une fraction de lignes comme ensemble de test : sélectionnez cette option afin que Minitab sélectionne de manière aléatoire l'ensemble de données de test. Vous pouvez spécifier la quantité de données à utiliser dans l'ensemble de données de test. La valeur par défaut de 0,3 fonctionne bien dans la plupart des cas. Vous souhaitez inclure suffisamment de données dans l'ensemble de données de test pour bien évaluer le modèle. Si vous n'êtes pas sûr de la forme du modèle, un ensemble de données de test plus grand permet une validation plus solide. Vous souhaitez également disposer de suffisamment de données dans l'ensemble de données d'apprentissage pour bien estimer le modèle. Généralement, les modèles avec plus de prédicteurs nécessitent plus de données d'apprentissage pour l'estimation.
- Définir la division d'apprentissage/de test par colonne d'ID : sélectionnez cette option pour choisir vous-même les lignes à inclure dans l'échantillon de test. Dans Colonne d'ID, saisissez la colonne qui indique les lignes à utiliser pour l'échantillon de test. La colonne d'ID ne doit contenir que deux valeurs. Dans Niveau pour l'ensemble de test, sélectionnez le niveau à utiliser comme échantillon de test.
- (Facultatif) Cochez Stocker la colonne d'ID pour la division d'apprentissage/de test pour enregistrer la colonne d'ID.