Considérations relatives aux données pour Ajuster le modèle de régression et Regressão Linear

Ajuster le modèle de régression et Regressão Linear effectuer la même analyse à partir de différents menus. Pour vous assurer que vos résultats sont valides, tenez compte des instructions suivantes lorsque vous collectez des données, effectuez l’analyse et interprétez vos résultats.

Les prédicteurs peuvent être continus ou catégoriques

Une variable continue peut être mesurée et ordonnée, et a un nombre infini de valeurs entre deux valeurs quelconques. Par exemple, le diamètre d’un échantillon de pneus est une variable continue.

Les variables catégorielles contiennent un nombre fini et dénombrable de catégories ou de groupes distincts. Les données catégorielles peuvent ne pas avoir d’ordre logique. Par exemple, les prédicteurs catégoriels incluent le sexe, le type de matériau et le mode de paiement.

Si vous avez une variable discrète, vous pouvez décider de la traiter comme un prédicteur continu ou catégoriel. Une variable discrète peut être mesurée et ordonnée, mais elle a un nombre dénombrable de valeurs. Par exemple, le nombre de personnes qui vivent dans un ménage est une variable discrète. La décision de traiter une variable discrète comme continue ou catégorique dépend du nombre de niveaux, ainsi que de l’objectif de l’analyse. Pour plus d’informations, consultez la page Que sont des variables de catégorie, discrètes et continues ?.

La variable de réponse doit être continue
Si la variable de réponse est catégorielle, votre modèle est moins susceptible de répondre aux hypothèses de l’analyse, de décrire avec précision vos données ou de faire des prédictions utiles.
  • Si votre variable de réponse comporte deux catégories, telles que réussite et échec, utilisez Ajuster le modèle logistique binaire.
  • Si votre variable de réponse contient au moins trois catégories qui ont un ordre naturel, telles que pas du tout d’accord, pas d’accord, neutre, d’accord et tout à fait d’accord, utilisez Régression logistique ordinale.
  • Si votre variable de réponse contient au moins trois catégories qui n’ont pas d’ordre naturel, telles que égratignure, bosse et déchirure, utilisez Régression logistique nominale.
  • Si votre variable de réponse compte des occurrences, telles que le nombre de défauts, utilisez Ajuster le modèle de Poisson.
Collectez des données à l’aide des meilleures pratiques
Pour vous assurer que vos résultats sont valides, tenez compte des directives suivantes :
  • Assurez-vous que les données représentent la population d’intérêt.
  • Collectez suffisamment de données pour fournir la précision nécessaire.
  • Mesurez les variables aussi précisément que possible.
  • Enregistrez les données dans l’ordre dans lequel elles sont collectées.
La corrélation entre les prédicteurs, également connue sous le nom de multicolinéarité, ne devrait pas être sévère

Si la multicolinéarité est sévère, il se peut que vous ne puissiez pas déterminer les prédicteurs à inclure dans le modèle. Pour déterminer la gravité de la multicolinéarité, utilisez les facteurs d’inflation de variance (VIF) dans le tableau des coefficients de la sortie.

Le modèle doit fournir un bon ajustement aux données

Si le modèle ne s’adapte pas aux données, les résultats peuvent être trompeurs. Dans la sortie, utilisez les tracés résiduels, les statistiques de diagnostic pour les observations inhabituelles et les statistiques récapitulatives du modèle pour déterminer dans quelle mesure le modèle s’ajuste aux données.