Choisissez la méthode de validation pour tester votre modèle. Habituellement, avec des échantillons plus petits, la méthode de validation croisée sur K partitions est appropriée. Avec des échantillons plus grands, vous pouvez sélectionner une fraction de cas à utiliser pour l'apprentissage et les tests.
Procédez comme suit si vous souhaitez utiliser la méthode de validation croisée sur K partitions pour valider l'échantillon de test. La méthode de validation croisée sur K partitions est la méthode par défaut lorsque le nombre de lignes est ≤ 5 000.
Procédez comme suit si vous souhaitez spécifier une fraction des données à utiliser pour l'apprentissage et les tests. La méthode de validation de l'ensemble de test est la méthode par défaut lorsque le nombre de lignes est > 5 000. Dans de nombreux cas, 70 % des données sont utilisées pour l'apprentissage et 30 % pour les tests.