Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.
Définissez si la validation est réalisée avec un ensemble de données de test en plus des données out-of-bag.
La fonction Classification Random Forests® utilise l'échantillonnage bootstrap pour chaque arbre. Chaque enregistrement d'un échantillon bootstrap est sélectionné de manière aléatoire avec remise à partir de l'ensemble de données d'origine. Certains enregistrements sont exclus de chaque échantillon bootstrap par rapport au total des observations de l'ensemble de données d'origine. Les lignes exclues d'un échantillon bootstrap forment un ensemble de données out-of-bag.
Procédez comme suit afin de spécifier une fraction des données à utiliser pour l’apprentissage et les tests. Si vous sélectionnez Validation avec un ensemble de tests en plus des données out-of-bag, Minitab utilise par défaut 30 % des données pour les tests.