Tests d'adéquation de l'ajustement pour la fonction Ajuster le modèle logistique binaire

Obtenez des définitions et bénéficiez de conseils en matière d'interprétation pour chaque statistique fournie dans le tableau des tests d'adéquation de l'ajustement.

Test d'adéquation de l'ajustement pour la somme des carrés d'écart

Le test d'adéquation de l'ajustement de la somme des carrés d'écart évalue la différence entre le modèle étudié et le modèle complet.

Interprétation

Utilisez des tests d'adéquation de l'ajustement pour déterminer si les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Cette liste énumère les raisons fréquentes de l'écart :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

Pour la régression logistique binaire, le format des données a un impact sur la valeur de p, car il modifie le nombre d'essais par ligne. En général, plus le nombre d'essais par ligne diminue, plus la valeur de p fournie par le test de la somme des carrés d'écart diminue. Le test de Hosmer-Lemeshow ne dépend pas du format des données. Lorsque les données présentent peu d'essais par ligne, le test de Hosmer-Lemeshow est un indicateur plus fiable de l'ajustement du modèle aux données. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.

Test d'adéquation de l'ajustement de Pearson

Le test d'adéquation de l'ajustement de Pearson évalue la différence entre le modèle étudié et le modèle complet.

Interprétation

Utilisez des tests d'adéquation de l'ajustement pour déterminer si les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Cette liste énumère les raisons fréquentes de l'écart :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

Pour la régression logistique binaire, le format des données a un impact sur la valeur de p, car il modifie le nombre d'essais par ligne. L'approximation de la loi du Khi deux utilisée par le test de Pearson est inexacte lorsque le nombre d'événements attendu par ligne est faible. Par conséquent, le test d'ajustement de Pearson est inexact lorsque les données sont au format réponse binaire/effectif. Le test de Hosmer-Lemeshow ne dépend pas du format des données. Lorsque les données présentent peu d'essais par ligne, le test de Hosmer-Lemeshow est un indicateur plus fiable de l'ajustement du modèle aux données. Pour plus d'informations, reportez-vous à la rubrique Influence du format des données sur l'ajustement dans la régression logistique binaire.

Hosmer-Lemeshow

Le test d'adéquation de l'ajustement de Hosmer-Lemeshow compare les effectifs attendus des événements et non événements aux effectifs observés afin d'évaluer l'ajustement du modèle aux données.

Interprétation

Utilisez des tests d'adéquation de l'ajustement pour déterminer si les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Si la valeur de p pour le test d'adéquation de l'ajustement est inférieure au seuil de signification sélectionné, les probabilités prévues diffèrent des probabilités observées d'une façon que ne prévoit pas la loi binomiale. Cette liste énumère les raisons fréquentes de l'écart :
  • Fonction de liaison incorrecte
  • Terme d'ordre supérieur omis pour les variables du modèle
  • Prédicteur omis non présent dans le modèle
  • Surdispersion

Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.

Le test de Hosmer-Lemeshow ne dépend pas du nombre d'essais par ligne dans les données, contrairement aux autres tests d'adéquation de l'ajustement. Lorsque les données présentent peu d'essais par ligne, le test de Hosmer-Lemeshow est un indicateur plus fiable de l'ajustement du modèle aux données.

Effectifs observés et espérance mathématique des effectifs pour le test de Hosmer-Lemeshow

Le modèle prévoit l'espérance mathématique des effectifs pour le test de Hosmer-Lemeshow.

Interprétation

Utilisez les effectifs observés et leur espérance mathématique dans le test de Hosmer-Lemeshow pour décrire l'ajustement du modèle aux données ou pour rechercher des zones de faible ajustement.

Par exemple, les tests d'adéquation de l'ajustement du modèle contenant le terme X produisent de faibles valeurs de p, ce qui indique que le modèle s'ajuste mal aux données. Dans le tableau des effectifs observés et de leur espérance mathématique, les valeurs prévues présentent des différences de plus de 10 événements pour tous les groupes sauf le groupe 4 lorsque la probabilité de l'événement se situe entre 0,32 et 0,325.

Lorsque le modèle comprend les termes X et X*X, les tests d'adéquation de l'ajustement donnent des valeurs de p élevées. Les données ne permettent pas de conclure que les probabilités estimées diffèrent des probabilités observées d'une façon non prévue par la loi binomiale. La plus grande différence entre les nombres d'événements observés et prévus se trouve dans le groupe 4. Cette différence est d'environ 7.

Régression logistique binaire : Evénement en fonction de X

Coefficients Terme Coeff Coef ErT FIV Constante -0,800 0,167 X 0,00092 0,00271 1,00
Tests d'adéquation de l'ajustement Valeur Test DL Khi deux de p Somme des carrés d'écart 3 78,50 0,000 Pearson 3 74,96 0,000 Hosmer-Lemeshow 3 74,96 0,000
Effectifs observés et espérance mathématique correspondante pour le test de Hosmer-Lemeshow Plage de probabilité Evénement Non-événement Groupe d'événement Observé Attendu Observé Attendu 1 (0,000; 0,310) 10 31,0 90 69,0 2 (0,310; 0,315) 40 31,5 60 68,5 3 (0,315; 0,320) 60 32,0 40 68,0 4 (0,320; 0,325) 35 32,5 65 67,5 5 (0,325; 0,330) 15 33,0 85 67,0

Régression logistique binaire : Evénement en fonction de X

Informations de réponse Nom Variable Valeur Dénombrement d'événement Evénement Evénement 160 Evénement Non-événement 340 Essai Total 500
Coefficients Terme Coeff Coef ErT FIV Constante -2,107 0,282 X 0,0904 0,0121 11,97 X*X -0,000889 0,000115 11,97
Tests d'adéquation de l'ajustement Valeur Test DL Khi deux de p Somme des carrés d'écart 2 3,78 0,151 Pearson 2 3,76 0,152 Hosmer-Lemeshow 3 3,76 0,288
Effectifs observés et espérance mathématique correspondante pour le test de Hosmer-Lemeshow Plage de probabilité Evénement Non-événement Groupe d'événement Observé Attendu Observé Attendu 1 (0,000; 0,108) 10 10,8 90 89,2 2 (0,108; 0,124) 15 12,4 85 87,6 3 (0,124; 0,401) 40 40,1 60 59,9 4 (0,401; 0,419) 35 41,9 65 58,1 5 (0,419; 0,548) 60 54,8 40 45,2
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique