Exemplo de Ajustar modelo logístico binário

Um consultor de marketing de uma empresa de cereais analisa a eficiência de uma propaganda de TV para um novo produto de cereal. O consultor mostra a propaganda em uma comunidade específica por uma semana. Em seguida, ele escolhe adultos aleatoriamente quando saem de um supermercado local para perguntar se eles viram a propaganda e compraram o novo cereal. O consultor também pergunta aos adultos se eles têm filhos e qual é a renda familiar anual.

Como a resposta é binária, o consultor usa regressão logística binária para determinar como a propaganda, ter filhos e a renda familiar anual estão relacionados à compra do cereal pelos adultos amostrados.

  1. Abra os dados amostrais, CompraDeCereal.MTW.
  2. Selecione Estat > Regressão > Regressão logística binária > Ajustar modelo logístico binário.
  3. Na lista suspensa, selecione Resposta no formato binário de resposta/frequência.
  4. Em Resposta, insira Compra.
  5. Em Preditores contínuos, insira Renda.
  6. Em Preditores categóricos, insira CriançasViuAnúncio.
  7. Clique em Opções. Em Nível de confiança de todos os intervalos, insira 90.
  8. Clique em OK em cada caixa de diálogo.

Interpretar os resultados

A tabela análise de variância mostra quais preditores têm uma relação estatisticamente significativa com a resposta. O consultor usa um nível de significância e os resultados indicam que as preditoras Filhos e ExibirAnúncio têm uma relação estatisticamente significativa com a resposta. Renda não tem uma relação estatisticamente significativa com a resposta porque o valor-p é maior do que 0,10. O consultor pode variar ao reajustar o modelo sem a variável de renda.

A razão de chances indica que os adultos com filhos têm aproximadamente mais probabilidade de comprar cereais do que os adultos que não têm filhos. A razão de chances para adultos que viram o anúncio indica que há 2,8 vezes de mais probabilidade de comprar o cereal do que adultos que ainda não viram o anuncio.

Os teste de qualidade do ajuste são todos maiores do que o nível de significância de 0,05, que indica que não há evidência suficiente para concluir que o modelo não se ajusta aos dados. O valor R2 indica que o modelo explica aproximadamente 12,¨% do deviance na resposta.

Método

Função de LigaçãoLogito
Codificação de preditores categóricos(1; 0)
Linhas usadas71

Informações da Resposta

VariávelValorContagem
Compra122(Evento)
  049 
  Total71 

Equação de Regressão

P(1)=exp(Y')/(1 + exp(Y'))
CriançasViuAnúncio
NãoNãoY'=-3,016 + 0,01374 Renda
         
NãoSimY'=-1,982 + 0,01374 Renda
         
SimNãoY'=-1,583 + 0,01374 Renda
         
SimSimY'=-0,5490 + 0,01374 Renda

Coeficientes

TermoCoefEP de CoefValor-ZValor-PVIF
Constante-3,0160,939-3,210,001 
Renda0,01370,01950,710,4811,15
Crianças         
  Sim1,4330,8561,670,0941,12
ViuAnúncio         
  Sim1,0340,5721,810,0701,03

Razões de Chances para Preditores Contínuos

Razão de
Chances
IC de 90%
Renda1,0138(0,9819; 1,0469)

Razões de Chances para Preditores Categóricos

Nível ANível BRazão de
Chances
IC de 90%
Crianças     
  SimNão4,1902(1,0245; 17,1386)
ViuAnúncio     
  SimNão2,8128(1,0982; 7,2044)
Razão de chances para o nível A em relação ao nível B

Sumário do Modelo

R2 DevianceR2 (Aj.)
Deviance
AICAICcBICÁrea sob a
curva ROC
12,66%9,25%84,7785,3793,820,7333

Testes de Qualidade de Ajuste

TesteGLQui-QuadradoValor-P
Deviance6776,770,194
Pearson6776,110,209
Hosmer-Lemeshow85,580,694

Análise de Variância



Teste de Wald
FonteGLQui-QuadradoValor-p
Regressão38,790,032
  Renda10,500,481
  Crianças12,800,094
  ViuAnúncio13,270,070

Ajustados e Diagnósticos para Observações Atípicas

Obs.Probabilidade
Observada
AjusteResídResíd Pad
501,0000,0622,3572,40R
681,0000,0912,1892,28R
R  Resíduo grande