Un effet décrit l'importance et le sens de la relation entre un terme et la variable de réponse. Minitab calcule les effets des facteurs et des interactions entre les facteurs.
L'effet d'un facteur représente le changement prévu dans la réponse moyenne lorsque le facteur passe du niveau inférieur au niveau supérieur. Les effets correspondent au double de la valeur des coefficients codés. Le signe de l'effet indique le sens de la relation entre le terme et la réponse.
Plus une interaction comporte de facteurs, plus il est plus difficile d'en interpréter l'effet. Pour les facteurs et les interactions entre facteurs, l'importance de l'effet aide généralement à évaluer si l'effet d'un terme sur la variable de réponse est significatif dans la pratique.
L'importance de l'effet n'indique pas si un terme est statistiquement significatif ou non, car le calcul de la signification prend également en compte la variation des données de réponse. Pour évaluer la signification statistique, examinez la valeur de p du terme.
Le coefficient décrit l'importance et le sens de la relation entre un terme du modèle et la variable de réponse. Pour minimiser la multicolinéarité entre les termes, les coefficients sont tous représentés en unités codées.
Le coefficient d'un terme représente le changement dans la réponse moyenne associée à une augmentation d'une unité codée de ce terme quand tous les autres prédicteurs sont maintenus constants. Le signe du coefficient indique le sens de la relation entre le terme et la réponse.
L'importance du coefficient correspond à la moitié de celle de l'effet. L'effet représente le changement prévu dans la réponse moyenne lorsque le facteur passe de son niveau inférieur à son niveau supérieur.
La valeur de l'effet aide généralement à évaluer si l'effet d'un terme sur la variable de réponse est significatif dans la pratique. L'importance de l'effet n'indique pas si un terme est statistiquement significatif ou non, car le calcul de la signification prend également en compte la variation des données de réponse. Pour évaluer la signification statistique, examinez la valeur de p du terme.
L'erreur type du coefficient estime la variabilité entre les estimations des coefficients que vous obtiendriez si vous préleviez des échantillons dans la même population de façon répétée. Le calcul suppose que le plan d'expériences et les coefficients à estimer restent identiques même après plusieurs échantillonnages.
Utilisez l'erreur type du coefficient pour mesurer la précision de l'estimation du coefficient. Plus l'erreur type est petite, plus l'estimation est précise. Si vous divisez le coefficient par son erreur type, vous obtiendrez une valeur de t. Si la valeur de p associée à cette statistique t est inférieure au seuil de signification, vous en concluez que le coefficient est significatif sur le plan statistique.
Ces intervalles de confiance (IC) sont des étendues de valeurs ayant de fortes chances de contenir la véritable valeur du coefficient pour chaque terme du modèle.
Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.
Un intervalle de confiance permet d'obtenir une estimation du coefficient de population pour chaque terme du modèle.
Par exemple, avec un niveau de confiance de 95 %, vous pouvez être sûr à 95 % que l'intervalle de confiance comprend la valeur ou le coefficient de la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon.
La valeur de t mesure le rapport entre le coefficient et son erreur type.
Minitab utilise la valeur de t pour calculer la valeur de p, qui permet de déterminer si le coefficient est significativement différent de 0.
Vous pouvez utiliser la valeur de t afin de déterminer si l'hypothèse nulle doit être rejetée. Cependant, la valeur de p est plus souvent utilisée, car le seuil de rejet de l'hypothèse nulle ne dépend pas des degrés de liberté. Pour plus d'informations sur l'utilisation de la valeur de t, reportez-vous à la rubrique Utiliser la valeur de t afin de déterminer si l'hypothèse nulle doit être rejetée.
La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.
Pour déterminer si un coefficient est statistiquement différent de 0, comparez la valeur de p du terme à votre seuil de signification afin d'évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient est égal à 0, ce qui implique qu'il n'existe aucune association entre le terme et la réponse.
En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique qu'il existe un risque de 5 % de conclure à tort que le coefficient n'est pas 0.
Le facteur d'inflation de la variance (FIV) indique dans quelle mesure la variance d'un coefficient est augmentée par les corrélations existant entre les prédicteurs du modèle.
Les FIV permettent de décrire l'importance de la multicolinéarité (la corrélation entre des prédicteurs) dans un modèle. Dans la plupart des plans factoriels, toutes les valeurs de FIV sont égales à 1, ce qui indique qu'il n'existe pas de multicolinéarité entre les prédicteurs. L'absence de multicolinéarité simplifie la détermination de la signification statistique. L'inclusion de covariables dans le modèle et l'occurrence d'essais ratés lors de la collecte de données sont deux situations courantes qui entraînent l'augmentation des FIV, ce qui complique l'interprétation de la signification statistique. En outre, pour les réponses binaires, les valeurs de FIV sont souvent supérieures à 1.
FIV | Etat du prédicteur |
---|---|
FIV = 1 | non corrélés |
1 < FIV < 5 | modérément corrélés |
FIV > 5 | hautement corrélés |
En cas de multicolinéarité, faites preuve de prudence lorsque vous vous fondez sur la signification statistique pour choisir les termes à enlever d'un modèle. Les termes doivent être ajoutés ou retirés un par un. A chaque modification du modèle, étudiez les changements dans les statistiques récapitulatives du modèle et les tests de signification statistiques.