Considérations relatives aux données pour Ajuster le modèle logistique binaire

Ajuster le modèle logistique binaire et Regressão Logística Binária effectuer la même analyse à partir de différents menus. Pour vous assurer que vos résultats sont valides, tenez compte des instructions suivantes lorsque vous collectez des données, effectuez l’analyse et interprétez vos résultats.

Les prédicteurs peuvent être continus ou catégoriques

Une variable continue peut être mesurée et ordonnée, et a un nombre infini de valeurs entre deux valeurs quelconques. Par exemple, le diamètre d’un échantillon de pneus est une variable continue.

Les variables catégorielles contiennent un nombre fini et dénombrable de catégories ou de groupes distincts. Les données catégorielles peuvent ne pas avoir d’ordre logique. Par exemple, les prédicteurs catégoriels incluent le sexe, le type de matériau et le mode de paiement.

Si vous avez une variable discrète, vous pouvez décider de la traiter comme un prédicteur continu ou catégoriel. Une variable discrète peut être mesurée et ordonnée, mais elle a un nombre dénombrable de valeurs. Par exemple, le nombre de personnes qui vivent dans un ménage est une variable discrète. La décision de traiter une variable discrète comme continue ou catégorique dépend du nombre de niveaux, ainsi que de l’objectif de l’analyse. Pour plus d’informations, consultez la page Que sont des variables de catégorie, discrètes et continues ?.

Si vous avez des prédicteurs catégoriels imbriqués ou aléatoires, utilisez Ajuster le modèle linéaire général si vous avez tous les facteurs fixes ou Ajuster le modèle à effets mixtes si vous avez des facteurs aléatoires. Pour Ajuster le modèle linéaire général, la réponse est continue.

La variable de réponse doit être binaire
Une réponse binaire a deux résultats, tels que réussite ou échec.
  • Si votre variable de réponse contient au moins trois catégories qui ont un ordre naturel, telles que pas du tout d’accord, pas d’accord, neutre, d’accord et tout à fait d’accord, utilisez Régression logistique ordinale.
  • Si votre variable de réponse contient au moins trois catégories qui n’ont pas d’ordre naturel, telles que égratignure, bosse et déchirure, utilisez Régression logistique nominale.
  • Si votre variable de réponse compte des occurrences, telles que le nombre de défauts, utilisez Ajuster le modèle de Poisson.
Envisager l’utilisation d’une technique de validation de modèle
Minitab vous permet de choisir de valider le modèle à l’aide d’un ensemble de données de test ou d’une validation croisée. Les statistiques récapitulatives du modèle, telles que la déviance R2, qui concernent les données du processus d’ajustement du modèle ont tendance à être optimistes. L’utilisation d’un ensemble de données de test ou d’une validation croisée peut donner une représentation plus précise des performances du modèle pour les nouvelles données.
Collectez des données à l’aide des meilleures pratiques
Pour vous assurer que vos résultats sont valides, tenez compte des directives suivantes :
  • Assurez-vous que les données représentent la population d’intérêt.
  • Collectez suffisamment de données pour fournir la précision nécessaire.
  • Mesurez les variables aussi précisément que possible.
  • Enregistrez les données dans l’ordre dans lequel elles sont collectées.
La corrélation entre les prédicteurs, également connue sous le nom de multicolinéarité, ne devrait pas être sévère

Si la multicolinéarité est sévère, il se peut que vous ne puissiez pas déterminer les prédicteurs à inclure dans le modèle. Pour déterminer la gravité de la multicolinéarité, utilisez les facteurs d’inflation de variance (VIF) dans le tableau des coefficients de la sortie.

Le modèle doit fournir un bon ajustement aux données

Si le modèle ne s’adapte pas aux données, les résultats peuvent être trompeurs. Dans la sortie, utilisez les tracés résiduels, les statistiques de diagnostic pour les observations inhabituelles et les statistiques récapitulatives du modèle pour déterminer dans quelle mesure le modèle s’ajuste aux données.