Observations relatives aux données pour la fonction Ajuster le modèle linéaire général

Pour garantir la validité de vos résultats, vérifiez que les règles suivantes sont respectées lorsque vous collectez des données, effectuez une analyse et interprétez vos résultats.

Les données doivent inclure au moins un facteur de catégorie

Les facteurs de catégorie peuvent être des facteurs emboîtés et croisés. Il peut aussi s'agir de facteurs aléatoires et fixes.

  • Pour un modèle avec des facteurs aléatoires, vous utilisez généralement la fonction Ajuster le modèle à effets mixtes de façon à pouvoir utiliser la méthode d'estimation par maximum de vraisemblance restreinte (REML).
  • Si vous disposez d'un facteur de catégorie et d'aucun prédicteur continu, vous pouvez également utiliser ANOVA à un facteur contrôlé.
  • Si vous disposez principalement de variables de prédiction continues, vous pouvez obtenir des résultats similaires pour votre modèle avec Ajuster le modèle de régression.
  • Si vous disposez d'un ou deux facteurs de catégorie et que vous souhaitez comparer les moyennes des niveaux à la moyenne globale pour des données qui suivent les lois normale, binomiale ou de Poisson, utilisez Analyse des moyennes.
  • Pour tester l'égalité des écarts types entre les groupes, utilisez Test de l'égalité des variances.

Pour plus d'informations sur les facteurs, consultez les rubriques Facteurs et niveaux de facteurs, Que sont les facteurs, les facteurs croisés et les facteurs emboîtés ? et Quelle est la différence entre les facteurs fixes et aléatoires ?.

La variable de réponse doit être continue
Si la variable de réponse est une variable de catégorie, le modèle est moins susceptible de satisfaire les hypothèses de l'analyse, de décrire précisément vos données ou de permettre des prévisions utiles.
  • Si vous disposez de plusieurs variables de réponse corrélées et d'un ensemble commun de facteurs, utilisez la fonction MANOVA générale, qui offre une meilleure puissance et peut détecter des schémas de réponses multivariés.
  • Si la variable de réponse contient deux catégories, comme Réussite et Echec, utilisez la fonction Ajuster le modèle logistique binaire.
  • Si la variable de réponse contient au moins trois catégories dont l'ordre est naturel, par exemple Absolument pas d'accord, Pas d'accord, Sans opinion, D'accord et Tout à fait d'accord, utilisez la fonction Régression logistique ordinale.
  • Si la variable de réponse contient au moins trois catégories qui n'ont pas d'ordre naturel, par exemple Eraflure, Entaille et Déchirure, utilisez la fonction Régression logistique nominale.
  • Si la variable de réponse dénombre des occurrences, comme le nombre de défauts, utilisez la fonction Ajuster le modèle de Poisson.
Chaque observation doit être indépendante de toutes les autres
Si vos observations ne sont pas indépendantes, les résultats ne seront peut-être pas valides. Tenez compte des points suivants pour déterminer si vos observations sont indépendantes :
  • Si une observation ne fournit aucune information sur la valeur d'une autre observation, cela signifie que les observations sont indépendantes.
  • Si une observation fournit des informations sur la valeur d'une autre observation, cela signifie que les observations sont dépendantes.
Les données d'échantillon doivent être sélectionnées de manière aléatoire

Les échantillons aléatoires permettent de faire des généralisations ou des déductions sur une population. Si les données n'ont pas été collectées de manière aléatoire, les résultats risquent de ne pas être représentatifs de la population.

Suivre les meilleures pratiques pour la collecte des données
Pour garantir la validité de vos résultats, suivez les indications suivantes :
  • Assurez-vous que les données sont représentatives de la population qui vous intéresse.
  • Collectez suffisamment de données pour bénéficier de la précision nécessaire.
  • Mesurez les variables de façon aussi exacte et précise que possible.
  • Enregistrez les données dans leur ordre de collecte.
La corrélation entre les prédicteurs, également appelée multicolinéarité, ne doit pas être trop importante

Si la multicolinéarité est importante, il se peut que vous ne puissiez pas déterminer les prédicteurs à inclure dans le modèle. Pour déterminer la sévérité de la multicolinéarité, utilisez les facteurs d'inflation de la variance (FIV) dans le tableau Coefficients des résultats.

Le modèle doit être bien ajusté aux données

Si le modèle n'est pas bien ajusté aux données, les résultats risquent d'être trompeurs. Dans les résultats, utilisez les graphiques des valeurs résiduelles, les statistiques de diagnostic pour les observations aberrantes, ainsi que les statistiques récapitulatives du modèle pour déterminer l'ajustement du modèle aux données.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique