Un coefficient de régression décrit l'importance et le sens de la relation entre un prédicteur et la variable de réponse. Les coefficients sont les nombres par lesquels les valeurs du terme sont multipliées dans une équation de régression.
Si le modèle comporte des termes d'interaction, l'interprétation des coefficients est complexe. Dans ces résultats, un ingénieur qualité veut évaluer la durée de stockage maximale d'un nouveau médicament. Le coefficient négatif associé au lot 1 indique que le médicament du lot 1 est moins puissant que pour le niveau de référence, à savoir le lot 6. En revanche, le coefficient associé à l'interaction Mois*Lot pour le lot 1 est positif. Etant donné que l'effet du temps dépend du lot, la différence entre le lot 1 et le lot 6 change au cours du temps.
Terme | Coeff | Coef ErT | Valeur de T | Valeur de p | FIV |
---|---|---|---|---|---|
Constante | 100,085 | 0,143 | 701,82 | 0,000 | |
Mois | -0,13633 | 0,00769 | -17,74 | 0,000 | 1,07 |
Lot | |||||
1 | -0,232 | 0,292 | -0,80 | 0,432 | 3,85 |
2 | 0,068 | 0,292 | 0,23 | 0,818 | 3,85 |
3 | 0,394 | 0,275 | 1,43 | 0,162 | 3,41 |
4 | -0,317 | 0,292 | -1,08 | 0,287 | 3,85 |
5 | 0,088 | 0,275 | 0,32 | 0,752 | * |
Mois*Lot | |||||
1 | 0,0454 | 0,0164 | 2,76 | 0,010 | 4,52 |
2 | -0,0241 | 0,0164 | -1,47 | 0,152 | 4,52 |
3 | -0,0267 | 0,0136 | -1,96 | 0,060 | 3,65 |
4 | 0,0014 | 0,0164 | 0,08 | 0,935 | 4,52 |
5 | 0,0040 | 0,0136 | 0,30 | 0,769 | * |
La taille du coefficient aide généralement à évaluer si l'effet d'un terme sur la variable de réponse est significatif dans la pratique. Toutefois, l'importance du coefficient n'indique pas si un terme est statistiquement significatif ou non car le calcul de la signification prend également en compte la variation des données de réponse. Pour évaluer la signification statistique, examinez la valeur de p du terme.
L'erreur type du coefficient permet d'évaluer le degré d'incertitude associé à l'estimation des coefficients à partir de données échantillons
Vous pouvez utiliser l'erreur type du coefficient pour mesurer la précision de l'estimation du coefficient. Plus l'erreur type est petite, plus l'estimation est précise. Si vous divisez le coefficient par son erreur type, vous obtiendrez une valeur de t. Si la valeur de p associée à cette statistique T est inférieure à votre seuil de signification (noté alpha ou α), vous pouvez en conclure que le coefficient est statistiquement significatif.
La valeur de t mesure le rapport entre le coefficient et son erreur type.
Minitab utilise la valeur de t pour calculer la valeur de p, qui permet de déterminer si le coefficient est significativement différent de 0.
Vous pouvez utiliser la valeur de t afin de déterminer si l'hypothèse nulle doit être rejetée. Cependant, la valeur de p est plus souvent utilisée, car le seuil de rejet de l'hypothèse nulle ne dépend pas des degrés de liberté. Pour plus d'informations sur l'utilisation de la valeur de t, reportez-vous à la rubrique Utiliser la valeur de t afin de déterminer si l'hypothèse nulle doit être rejetée.
La valeur de p est la probabilité qui mesure le degré de certitude avec lequel il est possible d'invalider l'hypothèse nulle. Des probabilités faibles permettent d'invalider l'hypothèse nulle avec plus de certitude.
Pour une étude de stabilité, le tableau des coefficients contient uniquement les termes dont la valeur de p est inférieure au seuil de signification défini pour l'analyse. L'hypothèse nulle est que le coefficient du terme est égal à zéro. Le seuil de signification par défaut est 0,25. Un seuil de signification de 0,25 indique un risque de 25 % de conclure à tort qu'il existe une association.
Ces intervalles de confiance (IC) sont des étendues de valeurs ayant de fortes chances de contenir la véritable valeur du coefficient pour chaque terme du modèle.
Les échantillons étant aléatoires, il est peu probable que deux échantillons d'une population donnent des intervalles de confiance identiques. Cependant, si vous prenez de nombreux échantillons aléatoires, un certain pourcentage des intervalles de confiance obtenus contiendra le paramètre de population inconnu. Le pourcentage de ces intervalles de confiance contenant le paramètre est le niveau de confiance de l'intervalle.
Un intervalle de confiance permet d'obtenir une estimation du coefficient de population pour chaque terme du modèle.
Par exemple, avec un niveau de confiance de 95 %, vous pouvez être sûr à 95 % que l'intervalle de confiance comprend la valeur ou le coefficient de la population. L'intervalle de confiance vous aide à évaluer la signification pratique de vos résultats. Utilisez vos connaissances spécialisées pour déterminer si l'intervalle de confiance comporte des valeurs ayant une signification pratique pour votre situation. Si l'intervalle est trop grand pour être utile, envisagez d'augmenter votre effectif d'échantillon.
Le facteur d'inflation de la variance (FIV) indique dans quelle mesure la variance d'un coefficient est augmentée par les corrélations existant entre les prédicteurs du modèle.
Les FIV permettent de décrire l'importance de la multicolinéarité (la corrélation entre des prédicteurs) dans une analyse de régression. La multicolinéarité est problématique car elle peut faire augmenter la variance des coefficients de régression, ce qui complique l'évaluation des conséquences de chacun des prédicteurs corrélés sur la réponse.
FIV | Etat du prédicteur |
---|---|
FIV = 1 | non corrélés |
1 < FIV < 5 | modérément corrélés |
FIV > 5 | hautement corrélés |
Pour plus d'informations sur la multicolinéarité et sur la façon d'atténuer ses effets, reportez-vous à la rubrique Multicolinéarité dans la régression.