Considérations relatives aux données pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Régression TreeNet®

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse doit être continue
Une variable continue peut être mesurée et ordonnée, et a un nombre infini de valeurs entre deux valeurs. Par exemple, le diamètre d'un échantillon de pneus est une variable continue.

Les données de la variable de réponse doivent être des valeurs numériques.

Si votre variable de réponse est une variable de catégorie, utilisez Ajuster le modèle ou Découvrir les prédicteurs principaux pour Classification TreeNet®.

Les variables de prédiction peuvent être continues ou de catégorie.
Vous pouvez utiliser une combinaison de prédicteurs continus ou de catégorie ; toutefois, les longueurs de colonne pour chaque prédicteur doivent être identiques à celle de la colonne de réponse. Les valeurs manquantes sont autorisées.
  • Tous les prédicteurs continus doivent être numériques.
  • Les prédicteurs de catégorie peuvent être des valeurs de texte ou numériques.
Un ensemble de test est recommandé lorsque le nombre de cas est > 2 000.

Par défaut, Minitab utilise la validation croisée lorsque le nombre de cas est ≤ 2 000. Lorsque le nombre de cas est supérieur à 2 000, Minitab utilise un ensemble de test. La validation croisée est généralement une meilleure méthode de validation, mais nécessite plus de temps pour calculer les résultats. La validation avec un ensemble de test est utile lorsque la méthode de validation croisée prend trop de temps.

Pour en savoir plus sur les paramètres des techniques de validation dans Ajuster le modèle et Découvrir les prédicteurs principaux, allez à Spécifier la méthode de validation pour Ajuster le modèle et Découvrir les prédicteurs principaux avec Régression TreeNet®.