Interprétation des résultats principaux pour la fonction Ajuster le modèle à effets mixtes

Suivez la procédure ci-dessous pour interpréter un modèle à effets mixtes.

Etape 1 : Déterminer si les termes aléatoires ont une influence significative sur la réponse

Pour déterminer si un terme aléatoire a une influence significative sur la réponse, comparez la valeur de p du terme dans le tableau des composantes de la variance au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique 5 % de risque de conclure à tort qu'il existe un effet.
Valeur de p ≤ α : le terme aléatoire influe de manière significative sur la réponse
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure que le terme aléatoire a une influence significative sur la réponse. Cela signifie que la variance du terme aléatoire est significativement différente de zéro.
Valeur de p > α : le terme aléatoire n'influe pas de manière significative sur la réponse
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure que le terme aléatoire influe de manière significative sur la réponse. Il est sans doute nécessaire de réajuster le modèle sans le terme non significatif afin d'évaluer l'effet du terme sur d'autres résultats.

Composantes de la variance

SourceVar% du totalVar. ErTValeur de ZValeur de p
Terrain0,07791972,93%0,0675801,1529960,124
Erreur0,02892427,07%0,0105622,7386130,003
Total0,106843       
Log de vraisemblance -2 = 7,736012
Résultats principaux : valeur de p

Dans ces résultats, le terrain est le terme aléatoire et la valeur de p pour le terrain est 0,124. Sachant que cette valeur est supérieure à 0,05, vous ne pouvez pas conclure que différents terrains contribuent à la variation du rendement.

Etape 2 : Déterminer si les termes d'effet fixe ont une influence significative sur la réponse

Pour déterminer si un terme a une influence significative sur la réponse, comparez la valeur de p au seuil de signification. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique 5 % de risque de conclure à tort qu'il existe une incidence.

L'interprétation de la valeur de p change entre une valeur de p pour un coefficient de facteur fixe ou de covariable.

Facteur fixe

Pour un facteur fixe, l'hypothèse nulle établit que le terme n'a pas d'influence significative sur la réponse.
Valeur de p ≤ α : le facteur fixe influe de manière significative sur la réponse

Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure que le facteur fixe influe de manière significative sur la réponse. Le rejet de l'hypothèse nulle signifie que l'effet d'un niveau est significativement différent des autres effets de niveaux du terme.

Valeur de p > α : le facteur fixe n'influe pas de manière significative sur la réponse
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure que le facteur fixe influe de manière significative sur la réponse. Il est sans doute nécessaire de réajuster le modèle sans le terme.

Covariable

Pour un terme de covariable, l'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse.
Valeur de p ≤ α : l'association est statistiquement significative.
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la covariable et la réponse.
Valeur de p > α : l'association n'est pas statistiquement significative.
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la covariable et la réponse. Il est sans doute nécessaire de réajuster le modèle sans la covariable.

Tests pour effets fixes

TermeDL NumDL DénValeur FValeur de p
Variété5,0015,0026,290,000
Résultats principaux : valeurs de p

La variété est le facteur fixe et la valeur de p du terme de variété est inférieur à 0,000. Sachant que cette valeur est inférieure à 0,05, vous pouvez conclure que les moyennes de niveaux ne sont pas toutes égales, ce qui signifie que la variété de la luzerne a un effet sur le rendement.

Pour mieux comprendre les effets principaux, reportez-vous à la rubrique Diagrammes factoriels.

Etape 3 : Déterminer l'ajustement du modèle à vos données

Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques d'adéquation de l'ajustement dans le tableau Récapitulatif du modèle.

S

S correspond à l'écart type estimé du terme d'erreur. Lorsque la valeur de S est faible, l'équation ajustée conditionnelle décrit mieux la réponse au niveau des paramètres de facteurs sélectionnés. Cependant, une valeur de S ne décrit pas à elle seule l'adaptation du modèle. Vous devez également examiner les résultats principaux des autres tableaux et les diagrammes des valeurs résiduelles.

R carré

R2 représente le pourcentage de variation de la réponse expliqué par le modèle. Cette valeur est calculée comme 1 moins le rapport de la somme des carrés de l'erreur (variation non expliquée par le modèle) sur la somme totale des carrés (variation totale du modèle).

R carré (ajust)

Utilisez la valeur de R2 ajusté pour comparer des modèles ayant la même structure de covariance, mais un nombre de facteurs fixes et de covariables différent. En supposant que les modèles ont la même structure de covariance, la valeur de R2 augmente lorsque vous ajoutez des facteurs fixes ou des covariables supplémentaires. La valeur de R2 ajusté intègre le nombre de facteurs fixes et de covariables du modèle pour vous aider à choisir le modèle correct.

AICc et BIC
Lorsque vous affichez les résultats développés de l'analyse, Minitab présente deux autres statistiques. Il s'agit du critère d'information d'Akaike corrigé (AICc) et du critère d'information bayésien (BIC). Ces statistiques vous permettent de comparer différents modèles. Des valeurs faibles sont souhaitables pour chacune.
Lors de l'interprétation des statistiques d'adéquation de l'ajustement, prenez en compte les points suivants :
  • Pour obtenir des estimations plus précises et moins biaisées pour les paramètres d'un modèle, le nombre de lignes dans un fichier de données doit généralement être nettement supérieur au nombre de paramètres dans le modèle. Pour obtenir des estimations assez justes des composantes de la variance des termes aléatoires, vous devez disposer de suffisamment de niveaux représentatifs pour chaque facteur aléatoire.

  • Les statistiques d'adéquation de l'ajustement ne sont qu'un des types de mesures permettant d'évaluer l'ajustement du modèle. Même si un modèle a une valeur souhaitable, vous devez consulter les graphiques des valeurs résiduelles pour vérifier que le modèle respecte les hypothèses.

Récapitulatif du modèle

SR carréR carré
(ajust)
AICcBIC
0,17007192,33%90,20%12,5413,52
Résultats principaux : S, R carré, R carré (ajust)

Dans ces résultats, l'écart type estimé (S) du terme d'erreur aléatoire est 0,17. Le modèle explique 92,33 % de la variation du rendement de la luzerne. Après avoir ajusté le nombre de paramètres de facteurs fixes dans le modèle, le pourcentage est réduit à 90,2 %.

Etape 4 : Evaluer l'influence de chaque niveau d'un terme d'effet fixe sur la réponse

Si la valeur de p indique qu'un terme est significatif, vous pouvez examiner les coefficients du terme afin de comprendre la relation entre le terme et la réponse. L'interprétation du coefficient change entre un coefficient de facteur fixe ou de covariable.

Les coefficients d'un facteur fixe indiquent la différence entre les moyennes des niveaux pour le terme. Vous pouvez également effectuer une analyse de comparaisons multiples pour le terme pour classer les effets de niveaux en groupes statistiquement égaux ou différents.

Le coefficient d'une covariable représente la variation de la réponse moyenne associée à la variation d'une unité de ce terme quand tous les autres éléments du modèle restent identiques. Le signe du coefficient indique le sens de la relation entre le terme et la réponse. La taille du coefficient aide généralement à évaluer la signification pratique du terme sur la variable de réponse.

Coefficients

TermeCoeffCoef ErTDLValeur de TValeur de p
Constante3,0945830,1438223,0021,5166920,000
Variété         
  10,3854170,07762615,004,9650160,000
  20,1454170,07762615,001,8732870,081
  30,1079170,07762615,001,3902050,185
  4-0,3195830,07762615,00-4,1169380,001
  50,3954170,07762615,005,0938380,000
Résultats principaux : coefficients

Les résultats affichent les coefficients pour cinq des six variétés de luzerne présents dans l'expérience. Par défaut, Minitab supprime un niveau de facteur pour éviter toute multicolinéarité parfaite. Les coefficients des effets principaux représentent la différence entre chaque moyenne de niveau et la moyenne générale. Par exemple, le facteur Variété 1 est associé à un rendement de la luzerne d'environ 0,385 unité de plus que la moyenne générale.

Etape 5 : Déterminer si votre modèle vérifie les hypothèses de l'analyse

Les graphiques des valeurs résiduelles permettent de déterminer si le modèle est adapté et si les hypothèses de l'analyse sont vérifiées. Si elles ne le sont pas, il se peut que le modèle ne soit pas ajusté aux données et vous devez être prudent lors de l'interprétation des résultats.

Remarque

Vous pouvez représenter les valeurs résiduelles conditionnelles et marginales. Une valeur résiduelle marginale correspond à la différence entre la valeur d'une réponse observée et la réponse moyenne estimée correspondante, sans condition sur les niveaux des facteurs aléatoires. En revanche, étant donné les niveaux spécifiques des facteurs aléatoires, une valeur résiduelle conditionnelle correspond à la différence entre la valeur d'une réponse observée et la réponse moyenne conditionnelle correspondante. Les valeurs résiduelles conditionnelles permettent de vérifier la normalité du terme d'erreur dans le modèle.

Graphique des valeurs résiduelles en fonction des valeurs ajustées

Le diagramme des valeurs résiduelles en fonction des valeurs ajustées affiche les valeurs résiduelles sur l'axe des y et les valeurs ajustées sur l'axe des x. Ce diagramme permet d'identifier les lignes de données dont les valeurs résiduelles sont les plus élevées. Etudiez ces lignes pour déterminer si elles sont collectées correctement. En outre, vous pouvez utiliser ce diagramme pour rechercher des schémas spécifiques dans les valeurs résiduelles pouvant indiquer d'autres variables à prendre en compte.

Graphique des valeurs résiduelles en fonction de l'ordre

Le diagramme des valeurs résiduelles en fonction de l'ordre affiche les valeurs résiduelles dans l'ordre dans lequel les données ont été collectées. Ce diagramme permet d'identifier les lignes de données dont les valeurs résiduelles sont les plus élevées. Etudiez ces lignes pour déterminer si elles sont collectées correctement. Si le diagramme indique un schéma dans l'ordre chronologique, vous pouvez essayez d'inclure un terme défini en fonction du temps dans le modèle pour supprimer le schéma.