Le coefficient décrit l'importance et le sens de la relation entre un terme du modèle et la variable de réponse. Pour minimiser la multicolinéarité entre les termes, les coefficients sont tous représentés en unités codées.
Le coefficient d'un terme représente le changement dans la réponse moyenne associée à une augmentation d'une unité codée de ce terme quand tous les autres termes sont maintenus constants. Le signe du coefficient indique le sens de la relation entre le terme et la réponse. L'importance de l'effet n'indique pas si un terme est statistiquement significatif ou non, car le calcul de la signification prend également en compte la précision des estimations de coefficients. Pour évaluer la signification statistique, examinez la valeur de p du terme.
Les termes qui ne comprennent pas de facteurs, tels que les termes de covariables et les termes de blocs, n'utilisent pas d'unités codées. L'interprétation de ces coefficients est différente.
L'erreur type du coefficient estime la variabilité entre les estimations des coefficients que vous obtiendriez si vous préleviez des échantillons dans la même population de façon répétée. Le calcul suppose que le plan d'expériences et les coefficients à estimer restent identiques même après plusieurs échantillonnages.
Utilisez l'erreur type du coefficient pour mesurer la précision de l'estimation du coefficient. Plus l'erreur type est petite, plus l'estimation est précise. Si vous divisez le coefficient par son erreur type, vous obtiendrez une valeur de t. Si la valeur de p associée à cette statistique t est inférieure au seuil de signification, vous en concluez que le coefficient est significatif sur le plan statistique.
Ces intervalles de confiance (IC) sont des étendues de valeurs ayant de fortes chances de contenir la véritable valeur du coefficient pour chaque terme du modèle.
Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.
Un intervalle de confiance permet d'obtenir une estimation du coefficient de population pour chaque terme du modèle.
Par exemple, avec un niveau de confiance de 95 %, vous pouvez être sûr à 95 % que l'intervalle de confiance comprend la valeur ou le coefficient de la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, vous devez sans doute augmenter votre effectif d'échantillon.
La valeur de t mesure le rapport entre le coefficient et son erreur type.
Minitab utilise la valeur de t pour calculer la valeur de p, qui permet de déterminer si le coefficient est significativement différent de 0.
Vous pouvez utiliser la valeur de t afin de déterminer si l'hypothèse nulle doit être rejetée. Cependant, la valeur de p est plus souvent utilisée, car le seuil de rejet de l'hypothèse nulle ne dépend pas des degrés de liberté. Pour plus d'informations sur l'utilisation de la valeur de t, reportez-vous à la rubrique Utiliser la valeur de t afin de déterminer si l'hypothèse nulle doit être rejetée.
Une valeur de p est une probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.
Pour déterminer si un coefficient est différent de 0, comparez la valeur de p du terme à votre seuil de signification afin d'évaluer l'hypothèse nulle. L'hypothèse nulle est que le coefficient est égal à 0, ce qui implique qu'il n'existe aucune association entre le terme et la réponse.
En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique qu'il existe un risque de 5 % de conclure à tort que le coefficient n'est pas 0.
Le facteur d'inflation de la variance (FIV) indique dans quelle mesure la variance d'un coefficient est augmentée par les corrélations existant entre les prédicteurs du modèle.
Les FIV permettent de décrire l'importance de la multicolinéarité (la corrélation entre des prédicteurs) dans un modèle. Le cas le plus courant pour les modèles de plans de criblage est la présence unique des effets principaux. Dans ce cas, le FIV est égal à 1 sauf en présence de covariables ou d'essais ratés. Les confusions partielles courantes dans les modèles de plans de criblage augmentent la multicolinéarité. La multicolinéarité complique la détermination de la signification statistique. L'inclusion de covariables dans le modèle et l'occurrence d'essais ratés pendant la collecte des données peuvent également augmenter les valeurs de FIV. Utilisez les directives suivantes pour interpréter les facteurs d'inflation de la variance :
FIV | Etat du prédicteur |
---|---|
FIV = 1 | non corrélés |
1 < FIV < 5 | modérément corrélés |
FIV > 5 | hautement corrélés |
En cas de multicolinéarité, faites preuve de prudence lorsque vous vous fondez sur la signification statistique pour choisir les termes à enlever d'un modèle. Les termes doivent être ajoutés ou retirés un par un. A chaque modification du modèle, étudiez les changements dans les statistiques récapitulatives du modèle et les tests de signification statistiques.