Interprétation des résultats principaux pour la fonction Ajuster le modèle de Poisson

Suivez les étapes ci-dessous pour interpréter un modèle de régression de Poisson. Les résultats principaux incluent la valeur de p, les coefficients, les statistiques récapitulatives du modèle et les diagrammes des valeurs résiduelles.

Etape 1 : Déterminer si l'association entre la réponse et le terme est statistiquement significative

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
  • Si un prédicteur continu est significatif, vous pouvez en conclure que le coefficient de ce prédicteur est différent de zéro.
  • Si un prédicteur de catégorie est significatif, vous pouvez en conclure que tous les niveaux n'ont pas le même nombre moyen d'événements.
  • Si un terme d'interaction est significatif, vous pouvez en conclure que la relation entre le prédicteur et le nombre d'événements dépend des autres prédicteurs du terme.
  • Si un terme polynomial est significatif, vous pouvez en conclure que la relation entre un prédicteur et le nombre d'événements dépend de la grandeur du prédicteur.

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Analyse de la variance Test de Wald Valeur Source DL Khi deux de P Régression 3 56,29 0,000 Heures depuis nettoyage 1 4,74 0,029 Température 1 38,46 0,000 Taille de vis 1 13,09 0,000

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Coefficients Terme Coeff Coef ErT FIV Constante 4,3982 0,0628 Heures depuis nettoyage 0,01798 0,00826 1,00 Température -0,001974 0,000318 1,00 Taille de vis petite -0,1546 0,0427 1,00
Résultats principaux : valeur de p, coefficients

Dans ces résultats, les trois prédicteurs sont statistiquement significatifs au niveau 0,05. Vous pouvez en conclure que la variation de ces variables entraîne une variation de la variable de réponse.

Utilisez le coefficient pour déterminer si la variation d'une variable de prévision augmente ou réduit la probabilité d'occurrence de l'événement. Le coefficient estimé associé à un prédicteur représente la variation de la fonction de liaison pour chaque variation d'une unité du prédicteur quand tous les autres prédicteurs sont maintenus constants. La relation entre le coefficient et le nombre d'événements dépend de plusieurs aspects de l'analyse, notamment la fonction de liaison et les niveaux de référence des prédicteurs de catégorie du modèle. En général, les coefficients positifs augmentent la probabilité de l'événement tandis que les coefficients négatifs la réduisent. Un coefficient estimé proche de zéro implique que l'effet du prédicteur est réduit ou inexistant.

L'interprétation des coefficients estimés pour les prédicteurs de catégorie est faite par rapport au niveau de référence du prédicteur. Des coefficients positifs indiquent que l'événement a plus de chances d'avoir lieu à ce niveau du prédicteur qu'au niveau de référence du facteur. Des coefficients négatifs indiquent que l'événement a moins de chances d'avoir lieu à ce niveau du prédicteur qu'au niveau de référence.

Le coefficient pour Heures depuis nettoyage est positif, ce qui suggère que les durées plus longues sont associées à des valeurs de réponse plus élevées. Le coefficient pour la température est négatif, ce qui suggère que les températures plus élevées sont associées à des valeurs de réponse plus faibles.

La taille de la vis est une variable de catégorie à un coefficient, ce qui signifie que la variable a deux niveaux et qu'elle utilise le codage 0, 1. Le coefficient pour la petite vis est négatif ; celle-ci est donc associée à des valeurs de réponse inférieures au niveau de référence.

Si un terme d'interaction est statistiquement significatif, la relation entre un prédicteur et la réponse diffère selon le niveau de l'autre prédicteur. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction. Pour mieux comprendre les effets principaux, les effets d'interaction et la courbure de votre modèle, reportez-vous aux rubriques Diagrammes factoriels et Optimisation des réponses.

Etape 2 : Déterminer si le modèle ne s'ajuste pas aux données

Utilisez les tests d'adéquation de l'ajustement pour déterminer si le nombre prévu d'événements diffère du nombre observé d'événements d'une façon que ne prévoit pas la loi de Poisson. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, vous pouvez rejeter l'hypothèse nulle selon laquelle la loi de Poisson offre un ajustement correct. Cette liste énumère les raisons fréquentes des écarts :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Tests d'adéquation de l'ajustement Valeur Test DL Estimation Moyenne Khi deux de p Somme des carrés des écarts 32 31,60722 0,98773 31,61 0,486 Pearson 32 31,26713 0,97710 31,27 0,503
Résultats principaux : test de la somme des carrés d'écart, test de Pearson

Dans ces résultats, les tests d'adéquation de l'ajustement ont des valeurs de p supérieures au seuil de signification habituel de 0,05. Cela ne suffit pas à en conclure que les nombres prévus d'événements diffèrent des nombres observés d'événements.

Etape 3 : Déterminer l'ajustement du modèle à vos données

Utilisez les valeurs AIC, AICc et BIC pour comparer différents modèles. Des valeurs faibles sont souhaitables pour chacune. Cependant, le modèle présentant la valeur la plus faible pour un ensemble de prédicteurs n'est pas forcément bien ajusté aux données. Vous devez aussi utiliser les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Récapitulatif du modèle R carré de R carré (ajust) la somme des de la somme des carrés des carrés des écarts écarts AIC AICc BIC 64,20% 60,80% 253,29 254,58 259,62

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Coefficients Terme Coeff Coef ErT FIV Constante 4,3982 0,0628 Heures depuis nettoyage 0,01798 0,00826 1,00 Température -0,001974 0,000318 1,00 Taille de vis petite -0,1546 0,0427 1,00
Résultats principaux : AIC

Dans le premier ensemble de résultats, l'AIC est d'environ 253. L'AICc est d'environ 255. Le BIC est d'environ 260. Ce modèle ne comprend pas l'interaction entre la température et la taille de la vis. Les critères d'information issus d'un seul modèle n'indiquent pas si le modèle est bien ajusté aux données, car ces valeurs dépendent de l'effectif d'échantillon.

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Récapitulatif du modèle R carré de R carré (ajust) la somme des de la somme des carrés des carrés des écarts écarts AIC AICc BIC 85,99% 81,46% 236,05 238,05 243,97

Analyse de régression de Poisson : Défauts déco en fonction de Heures depui; Température; ...

Coefficients Terme Coeff Coef ErT FIV Constante 4,5760 0,0736 Heures depuis nettoyage 0,01798 0,00826 1,00 Température -0,003285 0,000441 1,92 Taille de vis petite -0,5444 0,0990 5,37 Température*Taille de vis petite 0,002804 0,000640 6,64

Dans le second ensemble de résultats, l'AIC est d'environ 236. L'AICc est d'environ 238. Le BIC est d'environ 244. Ce modèle comprend l'interaction entre la température et la taille de la vis. Le fait que les valeurs soient plus faibles indique que le modèle incluant l'interaction fonctionne mieux.

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique