Considérations relatives aux données pour CART® Classification

Pour vous assurer que vos résultats sont valides, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l’analyse et interprétez vos résultats.

La variable de réponse (cible) doit être une variable de catégorie.
Les variables de catégorie contiennent un nombre limité et dénombrable de catégories ou de groupes distincts. Les données de catégorie peuvent ou non avoir un ordre logique. Par exemple, les variables de catégorie peuvent inclure le sexe de participants à une étude, un type de matériau ou un mode de paiement.
  • Si votre variable de réponse comporte deux catégories, telles que réussite et échec, alors la réponse est binaire.
  • Si votre variable de réponse contient trois catégories ou plus, la réponse est multinomiale.

Les données de la variable de réponse doivent être soit des valeurs de texte, soit des valeurs numériques. Les valeurs de date/heure sont interdites.

Si votre variable de réponse est continue, utilisez CART® Regression.

Les variables de prédiction peuvent être continues ou de catégorie.
Vous pouvez utiliser une combinaison de prédicteurs continus ou de catégorie ; toutefois, les longueurs de colonne pour chaque prédicteur doivent être identiques à celle de la colonne de réponse. Les valeurs manquantes sont autorisées.
  • Tous les prédicteurs continus doivent être numériques.
  • Les prédicteurs de catégorie peuvent être des valeurs de texte ou numériques.
Un ensemble de test est recommandé lorsque le nombre de cas est > 5 000

Par défaut, Minitab utilise la validation croisée lorsque le nombre de cas est ≤ 5 000. Lorsque le nombre de cas est supérieur à 5 000, Minitab utilise un ensemble de test. La validation avec un ensemble de données d'apprentissage et un ensemble de test de données est utile lorsque l’ensemble de données est volumineux. Pour en savoir plus sur les paramètres des techniques de validation dans CART® Classification, accédez à Spécifier la méthode de validation pour CART® Classification.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique