Exemple pour Ajuster le modèle logistique binaire

Un expert-conseil en marketing pour une entreprise de céréales étudie l'efficacité d'une publicité télévisée pour un nouveau produit céréalier. L'expert-conseil diffuse la publicité dans une communauté spécifique pendant une semaine. Puis, il sélectionne aléatoirement des personnes adultes à la sortie d'un supermarché local pour leur demander s'ils ont vu les publicités et acheté les nouvelles céréales. L'expert-conseil demande également aux adultes s'ils ont des enfants et le montant du revenu annuel de leur foyer.

Comme la réponse est binaire, l'expert-conseil utilise la régression logistique binaire pour déterminer la relation qui existe entre d'un côté la publicité, le fait d'avoir des enfants et le revenu annuel du foyer, et de l'autre le fait que les adultes de l'échantillon aient ou non acheté les céréales.

  1. Ouvrez le fichier de données échantillons, AchatCéréales.MTW.
  2. Sélectionnez .Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire
  3. Dans la liste déroulante, sélectionnez Réponse au format : réponse binaire/effectif.
  4. Dans la zone Réponse, saisissez Achat.
  5. Dans la zone Prédicteurs continus, saisissez Revenu.
  6. Dans la zone Prédicteurs de catégorie, saisissez EnfantsVuPub.
  7. Cliquez sur Options. Sous Niveau de confiance pour tous les intervalles, saisissez 90.
  8. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Le tableau Analyse de la variance affiche les prédicteurs ayant une relation statistiquement significative avec la réponse. Le consultant utilise un seuil de signification de 0,10, et les résultats indiquent que les prédicteurs Enfants et VuPub ont une relation statistiquement significative avec la réponse. Le revenu n'a pas une relation statistiquement significative avec la réponse, car la valeur de p est supérieure à 0,10. Le consultant doit sans doute réajuster le modèle sans la variable de revenu.

Le rapport des probabilités de succès indique que les adultes avec enfants sont environ 4,2 fois plus susceptibles d'acheter les céréales que ceux sans enfants. Le rapport des probabilités de succès des adultes ayant vu la publicité indique qu'ils sont 2,8 fois plus susceptibles d'acheter les céréales que ceux n'ayant pas vu la publicité.

Les tests d'adéquation de l'ajustement sont tous supérieurs au seuil de signification de 0,05, ce qui indique que vous n'êtes pas en mesure de conclure que le modèle n'est pas ajusté aux données. La valeur R2 indique que le modèle explique environ 12,7 % de la somme des carrés d'écart dans la réponse.

Méthode

Fonction de liaisonLogit
Codage des prédicteurs de catégorie(1; 0)
Lignes utilisées71

Informations de réponse

VariableValeurDénombrement
Achat122(Evénement)
  049 
  Total71 

Equation de régression

P(1)=exp(Y')/(1 + exp(Y'))
EnfantsVuPub
NonNonY'=-3,016 + 0,01374 Revenu
         
NonOuiY'=-1,982 + 0,01374 Revenu
         
OuiNonY'=-1,583 + 0,01374 Revenu
         
OuiOuiY'=-0,5490 + 0,01374 Revenu

Coefficients

TermeCoeffCoef ErTValeur de ZValeur de pFIV
Constante-3,0160,939-3,210,001 
Revenu0,01370,01950,710,4811,15
Enfants         
  Oui1,4330,8561,670,0941,12
VuPub         
  Oui1,0340,5721,810,0701,03

Rapports des probabilités de succès pour les prédicteurs continus

Rapport des
probabilités
de succès
IC à 90 %
Revenu1,0138(0,9819; 1,0469)

Rapports des probabilités de succès pour les prédicteurs de catégorie

Niveau ANiveau BRapport des
probabilités
de succès
IC à 90 %
Enfants     
  OuiNon4,1902(1,0245; 17,1386)
VuPub     
  OuiNon2,8128(1,0982; 7,2044)
Rapport des probabilités de succès pour le niveau A par rapport au niveau B

Récapitulatif du modèle

R carré de
la somme des
carrés des
écarts
R carré (ajust)
de la somme des
carrés des
écarts
AICAICcBICZone
située
sous la
courbe
ROC
12,66%9,25%84,7785,3793,820,7333

Tests d'adéquation de l'ajustement

TestDLKhi deuxValeur de p
Somme des carrés des écarts6776,770,194
Pearson6776,110,209
Hosmer-Lemeshow85,580,694

Analyse de la variance



Test de Wald
SourceDLKhi deuxValeur de P
Régression38,790,032
  Revenu10,500,481
  Enfants12,800,094
  VuPub13,270,070

Ajustements et diagnostics pour les observations aberrantes

ObservationProbabilité
observée
Valeur
ajustée
RésiduelleVal.
résid.
norm.
501,0000,0622,3572,40R
681,0000,0912,1892,28R
R : Valeur résiduelle élevée