Choisissez la méthode de validation pour tester votre modèle. Habituellement, avec des échantillons plus petits, la méthode de validation croisée K-ensemble est appropriée. Avec des échantillons plus grands, vous pouvez sélectionner une fraction de cas à utiliser pour l’apprentissage et les tests.
Procédez comme suit pour utiliser la méthode de validation croisée K-ensemble afin de valider l’échantillon de test. La méthode de validation croisée sur K partitions est la méthode par défaut lorsque le nombre de lignes est ≤ 5 000.
Procédez comme suit afin de spécifier une fraction des données à utiliser pour l’apprentissage et les tests. La méthode de validation de l’ensemble de tests est la méthode par défaut lorsque le nombre de lignes est > 5 000. Dans de nombreux cas, 70 % des données sont utilisées pour l’apprentissage et 30 % pour les tests.