Considérations relatives aux données pour Découvrir le meilleur modèle (réponse continue)

Remarque

Cette commande est disponible avec le Module d'analyse prédictive. Cliquez ici pour plus d'informations sur l'activation du module.

Pour vous assurer que vos résultats sont valables, tenez compte des indications suivantes lorsque vous collectez des données, effectuez l'analyse et interprétez vos résultats.

La variable de réponse doit être continue
Une variable continue peut être mesurée et ordonnée, et a un nombre infini de valeurs entre deux valeurs. Par exemple, le diamètre d'un échantillon de pneus est une variable continue.

Les données de la variable de réponse doivent être des valeurs numériques.

Si votre variable de réponse est une variable de catégorie, utilisez Découvrir le meilleur modèle (réponse binaire).

Les variables de prévision peuvent être continues ou de catégorie.
Vous pouvez utiliser une combinaison de prédicteurs continus ou de catégorie ; toutefois, les longueurs de colonne pour chaque prédicteur doivent être identiques à celle de la colonne de réponse. Les valeurs manquantes sont autorisées.
  • Tous les prédicteurs continus doivent être numériques.
  • Les prédicteurs de catégorie peuvent être des valeurs de texte ou numériques.
Un ensemble de test est recommandé lorsque le nombre de cas est > 2000.

Minitab utilise la validation croisée pour comparer les modèles lorsque le nombre de cas est ≤ 2000. Lorsque le nombre de cas est supérieur à 2000, Minitab utilise un ensemble de test. Lorsque l’ensemble de données est volumineux, la validation avec un ensemble de tests réduit le temps d’analyse des données. Pour en savoir plus sur les paramètres des techniques de validation dans Découvrir le meilleur modèle (réponse continue), allez à Spécifier la méthode de validation pour Découvrir le meilleur modèle (réponse continue).

Le modèle doit être correctement ajusté aux données

Si le modèle n'est pas correctement ajusté aux données, les résultats risquent d'être trompeurs. Tous les types de modèles incluent des statistiques récapitulatives de modèle qui décrivent les performances du modèle. Utilisez les résultats de la validation croisée ou de l’ensemble de tests pour déterminer si le modèle prédit bien la réponse. Dans la sortie d’un modèle de régression, utilisez également les graphiques résiduels pour vérifier que les hypothèses paramétriques sont exactes.