Considérations relatives aux données pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Classification TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse doit être de catégorie
Les variables de catégorie contiennent un nombre limité et dénombrable de catégories ou de groupes distincts. Les données de catégorie peuvent ou non avoir un ordre logique. Par exemple, les variables de catégorie peuvent inclure le sexe des participants à une étude, un type de matériau ou un mode de paiement.
  • Si votre variable de réponse comporte deux catégories, telles que réussite et échec, alors la réponse est binaire.
  • Si votre variable de réponse contient trois catégories ou plus, la réponse est multinomiale.

Les données de la variable de réponse doivent être soit des valeurs de texte, soit des valeurs numériques. Les valeurs de date/heure sont interdites.

Si votre variable de réponse est continue, utilisez Ajuster le modèle ou Découvrir les prédicteurs principaux pour Régression TreeNet®.

Les variables de prédiction peuvent être continues ou de catégorie.
Vous pouvez utiliser une combinaison de prédicteurs continus ou de catégorie ; toutefois, les longueurs de colonne pour chaque prédicteur doivent être identiques à celle de la colonne de réponse. Les valeurs manquantes sont autorisées.
  • Tous les prédicteurs continus doivent être numériques.
  • Les prédicteurs de catégorie peuvent être des valeurs de texte ou numériques.
Un ensemble de test est recommandé lorsque le nombre de cas est > 2 000.

Par défaut, Minitab utilise la validation croisée lorsque le nombre de cas est ≤ 2 000. Lorsque le nombre de cas est supérieur à 2 000, Minitab utilise un ensemble de test. La validation croisée est généralement une meilleure méthode de validation, mais nécessite plus de temps pour calculer les résultats. La validation avec un ensemble de test est utile lorsque la méthode de validation croisée prend trop de temps.

Pour en savoir plus sur les paramètres des techniques de validation dans Ajuster le modèle et Découvrir les prédicteurs principaux, allez à Spécifier la méthode de validation pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Classification TreeNet®.