Essais de qualité de l’ajustement pour Ajuster le modèle logistique binaire et Regressão Logística Binária

Vous trouverez des définitions et des conseils d’interprétation pour chaque statistique dans le tableau des tests de qualité de l’ajustement.

Test d'adéquation de l'ajustement pour la somme des carrés d'écart

Le test d'adéquation de l'ajustement de la somme des carrés d'écart évalue la différence entre le modèle étudié et le modèle complet.

Interprétation

Utilisez des tests d'adéquation de l'ajustement pour déterminer si les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Cette liste énumère les raisons fréquentes de l'écart :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

De nombreuses statistiques d'adéquation de l'ajustement sont influencées par la façon dont les données sont organisées dans la feuille de travail et par le nombre d'essais contenu dans chaque ligne (un ou plusieurs). La valeur de p du test de la somme des carrés des écarts a tendance à être plus faible lorsque les lignes de données ne contiennent qu'un seul essai chacune que lorsqu'elles en contiennent plusieurs ; elle a également à tendance à décroître lorsque le nombre d'essais par ligne diminue.

Le test de Hosmer-Lemeshow ne dépend pas du format des données. Lorsque les données présentent peu d'essais par ligne, le test de Hosmer-Lemeshow est un indicateur plus fiable de l'ajustement du modèle aux données. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.

Test d'adéquation de l'ajustement de Pearson

Le test d'adéquation de l'ajustement de Pearson évalue la différence entre le modèle étudié et le modèle complet.

Interprétation

Utilisez des tests d'adéquation de l'ajustement pour déterminer si les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Cette liste énumère les raisons fréquentes de l'écart :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

De nombreuses statistiques d'adéquation de l'ajustement sont influencées par la façon dont les données sont organisées dans la feuille de travail et par le nombre d'essais contenu dans chaque ligne (un ou plusieurs). L'approximation de la loi du Khi deux utilisée par le test de Pearson est inexacte lorsque le nombre d'événements attendu par ligne est faible. Par conséquent, le test d'adéquation de l'ajustement de Pearson est inexact lorsque les lignes ne contiennent qu'un seul essai.

Le test de Hosmer-Lemeshow ne dépend pas du format des données. Lorsque les données présentent peu d'essais par ligne, le test de Hosmer-Lemeshow est un indicateur plus fiable de l'ajustement du modèle aux données. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.

Hosmer-Lemeshow

Le test d'adéquation de l'ajustement de Hosmer-Lemeshow compare les effectifs attendus des événements et non événements aux effectifs observés afin d'évaluer l'ajustement du modèle aux données.

Interprétation

Utilisez des tests d'adéquation de l'ajustement pour déterminer si les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Cette liste énumère les raisons fréquentes de l'écart :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

Le test de Hosmer-Lemeshow ne dépend pas du nombre d'essais par ligne dans les données, contrairement aux autres tests d'adéquation de l'ajustement. Lorsque les données présentent peu d'essais par ligne, le test de Hosmer-Lemeshow est un indicateur plus fiable de l'ajustement du modèle aux données.

Effectifs observés et espérance mathématique des effectifs pour le test de Hosmer-Lemeshow

Le modèle prévoit l'espérance mathématique des effectifs pour le test de Hosmer-Lemeshow.

Interprétation

Utilisez les effectifs observés et leur espérance mathématique dans le test de Hosmer-Lemeshow pour décrire l'ajustement du modèle aux données ou pour rechercher des zones de faible ajustement.

Par exemple, les tests d'adéquation de l'ajustement du modèle contenant le terme X produisent de faibles valeurs de p, ce qui indique que le modèle s'ajuste mal aux données. Dans le tableau des effectifs observés et de leur espérance mathématique, les valeurs prévues présentent des différences de plus de 10 événements pour tous les groupes sauf le groupe 4 lorsque la probabilité de l'événement se situe entre 0,32 et 0,325.

Lorsque le modèle comprend les termes X et X*X, les tests d'adéquation de l'ajustement donnent des valeurs de p élevées. Les données ne permettent pas de conclure que les probabilités estimées diffèrent des probabilités observées d'une façon non prévue par la loi binomiale. La plus grande différence entre les nombres d'événements observés et prévus se trouve dans le groupe 4. Cette différence est d'environ 7.

Modèle avec X

Coefficients

TermeCoeffCoef ErTValeur de ZValeur de pFIV
Constante-0,8000,167-4,790,000 
X0,000920,002710,340,7351,00

Tests d'adéquation de l'ajustement

TestDLKhi deuxValeur de p
Somme des carrés des écarts378,500,000
Pearson374,960,000
Hosmer-Lemeshow374,960,000

Effectifs observés et espérance mathématique correspondante pour le test de Hosmer-Lemeshow


Plage de
probabilité
d'événement





EvénementNon-événement
GroupeObservéAttenduObservéAttendu
1(0,000; 0,310)1031,09069,0
2(0,310; 0,315)4031,56068,5
3(0,315; 0,320)6032,04068,0
4(0,320; 0,325)3532,56567,5
5(0,325; 0,330)1533,08567,0

Modèle avec X et X*X

Coefficients

TermeCoeffCoef ErTValeur de ZValeur de pFIV
Constante-2,1070,282-7,460,000 
X0,09040,01217,460,00011,97
X*X-0,0008890,000115-7,750,00011,97

Tests d'adéquation de l'ajustement

TestDLKhi deuxValeur de p
Somme des carrés des écarts23,780,151
Pearson23,760,152
Hosmer-Lemeshow33,760,288

Effectifs observés et espérance mathématique correspondante pour le test de Hosmer-Lemeshow


Plage de
probabilité
d'événement





EvénementNon-événement
GroupeObservéAttenduObservéAttendu
1(0,000; 0,108)1010,89089,2
2(0,108; 0,124)1512,48587,6
3(0,124; 0,401)4040,16059,9
4(0,401; 0,419)3541,96558,1
5(0,419; 0,548)6054,84045,2