Exemple pour la fonction Ajuster le modèle logistique binaire

Un expert-conseil en marketing pour une entreprise de céréales étudie l'efficacité d'une publicité télévisée pour un nouveau produit céréalier. L'expert-conseil diffuse la publicité dans une communauté spécifique pendant une semaine. Puis, il sélectionne aléatoirement des personnes adultes à la sortie d'un supermarché local pour leur demander s'ils ont vu les publicités et acheté les nouvelles céréales. L'expert-conseil demande également aux adultes s'ils ont des enfants et le montant du revenu annuel de leur foyer.

Comme la réponse est binaire, l'expert-conseil utilise la régression logistique binaire pour déterminer la relation qui existe entre d'un côté la publicité, le fait d'avoir des enfants et le revenu annuel du foyer, et de l'autre le fait que les adultes de l'échantillon aient ou non acheté les céréales.

  1. Ouvrez le fichier de données échantillons, AchatCéréales.MTW.
  2. Sélectionnez Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire.
  3. Dans la liste déroulante, sélectionnez Réponse au format : réponse binaire/effectif.
  4. Dans la zone Réponse, saisissez Achat.
  5. Dans la zone Prédicteurs continus, saisissez Revenu.
  6. Dans la zone Prédicteurs de catégorie, saisissez Enfants VuPub.
  7. Cliquez sur Options. Sous Niveau de confiance pour tous les intervalles, saisissez 90.
  8. Cliquez sur OK dans chaque boîte de dialogue.

Interprétation des résultats

Le tableau de la somme des carrés d'écart affiche les prédicteurs ayant une relation statistiquement significative avec la réponse. Le consultant utilise un seuil de signification de 0,10, et les résultats indiquent que les prédicteurs Enfants et VuPub ont une relation statistiquement significative avec la réponse. Le revenu n'a pas une relation statistiquement significative avec la réponse, car la valeur de p est supérieure à 0,10. Le consultant doit sans doute réajuster le modèle sans la variable de revenu.

Le rapport des probabilités de succès indique que les adultes avec enfants sont environ 4,2 fois plus susceptibles d'acheter les céréales que ceux sans enfants. Le rapport des probabilités de succès des adultes ayant vu la publicité indique qu'ils sont 2,8 fois plus susceptibles d'acheter les céréales que ceux n'ayant pas vu la publicité.

Les tests d'adéquation de l'ajustement sont tous supérieurs au seuil de signification de 0,05, ce qui indique que vous n'êtes pas en mesure de conclure que le modèle n'est pas ajusté aux données. La valeur R2 indique que le modèle explique environ 12,7 % de la somme des carrés d'écart dans la réponse.

Régression logistique binaire : Achat en fonction de Revenu; Enfants; VuPub

Méthode Fonction de liaison Logit Codage des prédicteurs de catégorie (1; 0) Lignes utilisées 71
Informations de réponse Variable Valeur Dénombrement Achat 1 22 (Evénement) 0 49 Total 71
Tableau des sommes des carrés d'écart Somme des carrés d'écart Moyenne Valeur Source DL ajustée ajustée Khi deux de p Régression 3 11,1298 3,7099 11,13 0,011 Revenu 1 0,4985 0,4985 0,50 0,480 Enfants 1 3,3886 3,3886 3,39 0,066 VuPub 1 3,3764 3,3764 3,38 0,066 Erreur 67 76,7665 1,1458 Total 70 87,8963
Récapitulatif du modèle R carré R carré de (ajust) de la somme la somme des carrés des carrés d'écart d'écart AIC 12,66% 9,25% 84,77
Coefficients Terme Coeff Coef ErT FIV Constante -3,016 0,939 Revenu 0,0137 0,0195 1,15 Enfants Oui 1,433 0,856 1,12 VuPub Oui 1,034 0,572 1,03
Rapports des probabilités de succès pour les prédicteurs continus Rapport des probabilités de succès IC à 90 % Revenu 1,0138 (0,9818; 1,0469)
Rapports des probabilités de succès pour les prédicteurs de catégorie Rapport des probabilités Niveau A Niveau B de succès IC à 90 % Enfants Oui Non 4,1902 (1,0242; 17,1425) VuPub Oui Non 2,8128 (1,0982; 7,2046) Rapport des probabilités de succès pour le niveau A par rapport au niveau B
Equation de régression P(1) = exp(Y')/(1 + exp(Y'))
Enfants VuPub Non Non Y' = -3,016 + 0,01374 Revenu Non Oui Y' = -1,982 + 0,01374 Revenu Oui Non Y' = -1,583 + 0,01374 Revenu Oui Oui Y' = -0,5490 + 0,01374 Revenu
Tests d'adéquation de l'ajustement Valeur Test DL Khi deux de p Somme des carrés d'écart 67 76,77 0,194 Pearson 67 76,11 0,209 Hosmer-Lemeshow 8 5,58 0,694
Ajustements et diagnostics pour les observations aberrantes Val. Probabilité Valeur résid. Observation observée ajustée Résiduelle norm. 50 1,000 0,062 2,357 2,40 R 68 1,000 0,091 2,189 2,28 R R : Valeur résiduelle élevée
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique