Considérations relatives aux données pour CART® Regression

Pour vous assurer que vos résultats sont valides, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse (cible) doit être continue.
Une variable continue peut être mesurée et ordonnée, et a un nombre infini de valeurs entre deux valeurs. Par exemple, le diamètre d'un échantillon de pneus est une variable continue.

Les données de la variable de réponse doivent être des valeurs numériques.

Si votre variable de réponse est une variable de catégorie, utilisez CART® Classification.

Les variables de prévision peuvent être continues ou de catégorie.
Vous pouvez utiliser une combinaison de prédicteurs continus ou de catégorie ; toutefois, les longueurs de colonne pour chaque prédicteur doivent être identiques à celle de la colonne de réponse. Les valeurs manquantes sont autorisées.
  • Tous les prédicteurs continus doivent être numériques.
  • Les prédicteurs de catégorie peuvent être des valeurs de texte ou numériques.
Un ensemble de test est recommandé lorsque le nombre de cas est > 5 000.

Par défaut, Minitab utilise la validation croisée lorsque le nombre de cas est ≤ 5 000. Lorsque le nombre de cas est supérieur à 5 000, Minitab utilise un ensemble de test. La validation avec un ensemble de données d'apprentissage et un ensemble de données de test est utile lorsque l'ensemble de données est volumineux. Pour en savoir plus sur les paramètres des techniques de validation dans CART® Regression, allez à Spécifier la méthode de validation pour CART® Regression.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique