Observations relatives aux données pour une ANOVA équilibrée

Pour garantir la validité de vos résultats, vérifiez que les règles suivantes sont respectées lorsque vous collectez des données, effectuez une analyse et interprétez vos résultats.

Les données doivent inclure uniquement des facteurs de catégorie

Si votre plan contient des covariables, utilisez Ajuster le modèle linéaire général.

Les facteurs de catégorie peuvent être des facteurs emboîtés et croisés. Il peut aussi s'agir de facteurs aléatoires et fixes.

Pour plus d'informations sur les facteurs, consultez les rubriques Facteurs et niveaux de facteurs, Que sont les facteurs, les facteurs croisés et les facteurs emboîtés ? et Quelle est la différence entre les facteurs fixes et aléatoires ?.

Le plan doit être équilibré, sauf s'il s'agit d'un plan à un facteur contrôlé

Un plan équilibré a le même nombre d'observations pour chaque combinaison de traitements.

Cette exigence s'étend également aux facteurs emboîtés. Supposons que A ait 3 niveaux et que B soit emboîté dans A. Si B a 4 niveaux dans le premier niveau de A, B doit avoir 4 niveaux dans les deuxième et troisième niveaux de A. Minitab vous informe en cas d'emboîtement non équilibré. L'équilibre des données doit être préservé une fois les données manquantes omises.

Si le plan n'est pas équilibré, utilisez Ajuster le modèle linéaire général.

Pour plus d'informations sur les plans équilibrés, reportez-vous à la rubrique Plans équilibrés et non équilibrés.

Les facteurs emboîtés doivent utiliser le même ensemble d'indices

Les indices utilisés pour identifier les 4 niveaux de B dans chacun des niveaux de A doivent être les mêmes. Donc les quatre niveaux de B ne peuvent pas être (1 2 3 4) dans le niveau 1 de A, (5 6 7 8) dans le niveau 2 de A et (9 10 11 12) dans le niveau 3 de A.

La variable de réponse doit être continue

Si la variable de réponse est une variable de catégorie, le modèle est moins susceptible de satisfaire les hypothèses de l'analyse, de décrire précisément vos données ou de permettre des prévisions utiles.

Si la variable de réponse contient deux catégories, comme Réussite et Echec, utilisez la fonction Ajuster le modèle logistique binaire.
Si la variable de réponse contient au moins trois catégories dont l'ordre est naturel, par exemple Absolument pas d'accord, Pas d'accord, Sans opinion, D'accord et Tout à fait d'accord, utilisez la fonction Régression logistique ordinale.
Si la variable de réponse contient au moins trois catégories qui n'ont pas d'ordre naturel, par exemple Eraflure, Entaille et Déchirure, utilisez la fonction Régression logistique nominale.
Si la variable de réponse dénombre des occurrences, comme le nombre de défauts, utilisez la fonction Ajuster le modèle de Poisson.

Chaque observation doit être indépendante de toutes les autres

Si vos observations ne sont pas indépendantes, les résultats ne seront peut-être pas valides. Tenez compte des points suivants pour déterminer si vos observations sont indépendantes :

Si une observation ne fournit aucune information sur la valeur d'une autre observation, cela signifie que les observations sont indépendantes.
Si une observation fournit des informations sur la valeur d'une autre observation, cela signifie que les observations sont dépendantes.

Les données d'échantillon doivent être sélectionnées de manière aléatoire

Les échantillons aléatoires permettent de faire des généralisations ou des déductions sur une population. Si les données n'ont pas été collectées de manière aléatoire, les résultats risquent de ne pas être représentatifs de la population.

Suivre les meilleures pratiques pour la collecte des données

Pour garantir la validité de vos résultats, suivez les indications suivantes :

Assurez-vous que les données sont représentatives de la population qui vous intéresse.
Collectez suffisamment de données pour bénéficier de la précision nécessaire.
Mesurez les variables de façon aussi exacte et précise que possible.
Enregistrez les données dans leur ordre de collecte.

Le modèle doit être bien ajusté aux données

Si le modèle n'est pas bien ajusté aux données, les résultats risquent d'être trompeurs. Dans les résultats, utilisez les graphiques des valeurs résiduelles et les statistiques récapitulatives du modèle pour déterminer l'ajustement du modèle aux données.