Interprétation des résultats principaux pour la fonction Ajuster le modèle de Poisson

Suivez les étapes ci-dessous pour interpréter un modèle de régression de Poisson. Les résultats principaux incluent la valeur de p, les coefficients, les statistiques récapitulatives du modèle et les diagrammes des valeurs résiduelles.

Etape 1 : Déterminer si l'association entre la réponse et le terme est statistiquement significative

Pour déterminer si l'association entre la réponse et chacun des termes du modèle est statistiquement significative, comparez la valeur de p du terme à votre seuil de signification pour évaluer l'hypothèse nulle. L'hypothèse nulle est qu'il n'existe aucune association entre le terme et la réponse. En général, un seuil de signification (noté alpha ou α) de 0,05 fonctionne bien. Un seuil de signification de 0,05 indique un risque de 5 % de conclure à tort qu'il existe une association.
Valeur de p ≤ α : l'association est statistiquement significative
Si la valeur de p est inférieure ou égale au seuil de signification, vous pouvez conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme.
Valeur de p > α : l'association n'est pas statistiquement significative
Si la valeur de p est supérieure au seuil de signification, vous ne pouvez pas conclure qu'il existe une association statistiquement significative entre la variable de réponse et le terme. Il est sans doute nécessaire de réajuster le modèle sans le terme.
Si plusieurs prédicteurs ne présentent aucune association statistiquement significative avec la réponse, vous pouvez réduire le modèle en supprimant ces termes un par un. Pour plus d'informations sur la suppression de termes d'un modèle, reportez-vous à la rubrique Réduction du modèle.
Si un terme d'un modèle est statistiquement significatif, l'interprétation dépend du type de terme concerné. Les interprétations sont les suivantes :
  • Si un prédicteur continu est significatif, vous pouvez en conclure que le coefficient de ce prédicteur est différent de zéro.
  • Si un prédicteur de catégorie est significatif, vous pouvez en conclure que tous les niveaux n'ont pas le même nombre moyen d'événements.
  • Si un terme d'interaction est significatif, vous pouvez en conclure que la relation entre le prédicteur et le nombre d'événements dépend des autres prédicteurs du terme.
  • Si un terme polynomial est significatif, vous pouvez en conclure que la relation entre un prédicteur et le nombre d'événements dépend de la grandeur du prédicteur.

Analyse de la variance



Test de Wald
SourceDLKhi deuxValeur de P
Régression356,290,000
  Heures depuis nettoyage14,740,029
  Température138,460,000
  Taille de vis113,090,000

Coefficients

TermeCoeffCoef ErTValeur de ZValeur de pFIV
Constante4,39820,062870,020,000 
Heures depuis nettoyage0,017980,008262,180,0291,00
Température-0,0019740,000318-6,200,0001,00
Taille de vis         
  petite-0,15460,0427-3,620,0001,00
Résultats principaux : valeur de p, coefficients

Dans ces résultats, les trois prédicteurs sont statistiquement significatifs au niveau 0,05. Vous pouvez en conclure que la variation de ces variables entraîne une variation de la variable de réponse.

Utilisez le coefficient pour déterminer si la variation d'une variable de prévision augmente ou réduit la probabilité d'occurrence de l'événement. Le coefficient estimé associé à un prédicteur représente la variation de la fonction de liaison pour chaque variation d'une unité du prédicteur quand tous les autres prédicteurs sont maintenus constants. La relation entre le coefficient et le nombre d'événements dépend de plusieurs aspects de l'analyse, notamment la fonction de liaison et les niveaux de référence des prédicteurs de catégorie du modèle. En général, les coefficients positifs augmentent la probabilité de l'événement tandis que les coefficients négatifs la réduisent. Un coefficient estimé proche de zéro implique que l'effet du prédicteur est réduit ou inexistant.

L'interprétation des coefficients estimés pour les prédicteurs de catégorie est faite par rapport au niveau de référence du prédicteur. Des coefficients positifs indiquent que l'événement a plus de chances d'avoir lieu à ce niveau du prédicteur qu'au niveau de référence du facteur. Des coefficients négatifs indiquent que l'événement a moins de chances d'avoir lieu à ce niveau du prédicteur qu'au niveau de référence.

Le coefficient pour Heures depuis nettoyage est positif, ce qui suggère que les durées plus longues sont associées à des valeurs de réponse plus élevées. Le coefficient pour la température est négatif, ce qui suggère que les températures plus élevées sont associées à des valeurs de réponse plus faibles.

La taille de la vis est une variable de catégorie à un coefficient, ce qui signifie que la variable a deux niveaux et qu'elle utilise le codage 0, 1. Le coefficient pour la petite vis est négatif ; celle-ci est donc associée à des valeurs de réponse inférieures au niveau de référence.

Si un terme d'interaction est statistiquement significatif, la relation entre un prédicteur et la réponse diffère selon le niveau de l'autre prédicteur. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction. Pour mieux comprendre les effets principaux, les effets d'interaction et la courbure de votre modèle, reportez-vous aux rubriques Diagrammes factoriels et Optimisation des réponses.

Etape 2 : Déterminer si le modèle ne s'ajuste pas aux données

Utilisez les tests d'adéquation de l'ajustement pour déterminer si le nombre prévu d'événements diffère du nombre observé d'événements d'une façon que ne prévoit pas la loi de Poisson. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, vous pouvez rejeter l'hypothèse nulle selon laquelle la loi de Poisson offre un ajustement correct. Cette liste énumère les raisons fréquentes des écarts :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

Tests d'adéquation de l'ajustement

TestDLEstimationMoyenneKhi deuxValeur de p
Somme des carrés des écarts3231,607220,9877331,610,486
Pearson3231,267130,9771031,270,503
Résultats principaux : test de la somme des carrés d'écart, test de Pearson

Dans ces résultats, les tests d'adéquation de l'ajustement ont des valeurs de p supérieures au seuil de signification habituel de 0,05. Cela ne suffit pas à en conclure que les nombres prévus d'événements diffèrent des nombres observés d'événements.

Etape 3 : Déterminer l'ajustement du modèle à vos données

Utilisez les valeurs AIC, AICc et BIC pour comparer différents modèles. Des valeurs faibles sont souhaitables pour chacune. Cependant, le modèle présentant la valeur la plus faible pour un ensemble de prédicteurs n'est pas forcément bien ajusté aux données. Vous devez aussi utiliser les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.

Récapitulatif du modèle

R carré de
la somme des
carrés des
écarts
R carré (ajust)
de la somme des
carrés des
écarts
AICAICcBIC
64,20%60,80%253,29254,58259,62

Coefficients

TermeCoeffCoef ErTValeur de ZValeur de pFIV
Constante4,39820,062870,020,000 
Heures depuis nettoyage0,017980,008262,180,0291,00
Température-0,0019740,000318-6,200,0001,00
Taille de vis         
  petite-0,15460,0427-3,620,0001,00
Résultats principaux : AIC

Dans le premier ensemble de résultats, l'AIC est d'environ 253. L'AICc est d'environ 255. Le BIC est d'environ 260. Ce modèle ne comprend pas l'interaction entre la température et la taille de la vis. Les critères d'information issus d'un seul modèle n'indiquent pas si le modèle est bien ajusté aux données, car ces valeurs dépendent de l'effectif d'échantillon.

Récapitulatif du modèle

R carré de
la somme des
carrés des
écarts
R carré (ajust)
de la somme des
carrés des
écarts
AICAICcBIC
85,99%81,46%236,05238,05243,97

Coefficients

TermeCoeffCoef ErTValeur de ZValeur de pFIV
Constante4,57600,073662,150,000 
Heures depuis nettoyage0,017980,008262,180,0291,00
Température-0,0032850,000441-7,460,0001,92
Taille de vis         
  petite-0,54440,0990-5,500,0005,37
Température*Taille de vis         
  petite0,0028040,0006404,380,0006,64

Dans le second ensemble de résultats, l'AIC est d'environ 236. L'AICc est d'environ 238. Le BIC est d'environ 244. Ce modèle comprend l'interaction entre la température et la taille de la vis. Le fait que les valeurs soient plus faibles indique que le modèle incluant l'interaction fonctionne mieux.