Considérations relatives aux données pour Découvrir le meilleur modèle (réponse binaire)

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse doit être binaire

Une réponse binaire donne deux résultats possibles, par exemple réussite ou échec. Si votre variable de réponse est continue, utilisez Découvrir le meilleur modèle (réponse continue).

Les prédicteurs peuvent être continus ou de catégorie

Une variable continue peut être mesurée et ordonnée, et a un nombre infini de valeurs entre deux valeurs. Par exemple, le diamètre d'un échantillon de pneus est une variable continue.

Les variables de catégorie contiennent un nombre limité et dénombrable de catégories ou de groupes distincts. Les données de catégorie peuvent ne pas présenter d'ordre logique. Par exemple, les prédicteurs de catégorie incluent le sexe d'individus, le type de matériel et le mode de paiement.

Si vos données comportent une variable discrète, vous pouvez décider de la traiter comme un prédicteur continu ou de catégorie. Une variable discrète peut être mesurée et ordonnée, mais ses valeurs son dénombrables. Par exemple, le nombre de personnes vivant dans une maison est une variable discrète. Le choix de traiter une variable discrète comme un prédicteur continu ou de catégorie dépend du nombre de niveaux, ainsi que de l'objectif de l'analyse. Pour plus d'informations, accédez à Que sont des variables de catégorie, discrètes et continues ?.

Un ensemble de test est recommandé lorsque le nombre de cas est > 2000.

Minitab utilise la validation croisée pour comparer les modèles lorsque le nombre de cas est ≤ 2000. Lorsque le nombre de cas est supérieur à 2000, Minitab utilise un ensemble de test. Lorsque l’ensemble de données est volumineux, la validation avec un ensemble de tests réduit le temps d’analyse des données. Pour en savoir plus sur les paramètres des techniques de validation dans Découvrir le meilleur modèle (réponse binaire), allez à Spécifier la méthode de validation pour Découvrir le meilleur modèle (réponse binaire).

Le modèle doit être correctement ajusté aux données

Si le modèle n'est pas correctement ajusté aux données, les résultats risquent d'être trompeurs. Tous les types de modèles incluent des statistiques récapitulatives de modèle qui décrivent les performances du modèle. Utilisez les résultats de la validation croisée ou de l’ensemble de tests pour déterminer si le modèle prédit bien la réponse.