Considérations relatives aux données pour Classification Random Forests®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse doit être de catégorie
Les variables de catégorie contiennent un nombre limité et dénombrable de catégories ou de groupes distincts. Les données de catégorie peuvent ou non avoir un ordre logique. Par exemple, les variables de catégorie peuvent inclure le sexe des participants à une étude, un type de matériau ou un mode de paiement.
  • Si votre variable de réponse comporte deux catégories, telles que réussite et échec, alors la réponse est binaire.
  • Si votre variable de réponse contient trois catégories ou plus, la réponse est multinomiale.

Les données de la variable de réponse doivent être soit des valeurs de texte, soit des valeurs numériques. Les valeurs de date/heure sont interdites.

Si votre variable de réponse est continue, utilisez Régression Random Forests®.

Les variables de prédiction peuvent être continues ou de catégorie.
Vous pouvez utiliser une combinaison de prédicteurs continus ou de catégorie ; toutefois, les longueurs de colonne pour chaque prédicteur doivent être identiques à celle de la colonne de réponse. Les valeurs manquantes sont autorisées.
  • Tous les prédicteurs continus doivent être numériques.
  • Les prédicteurs de catégorie peuvent être des valeurs de texte ou numériques.