Considerações de dados para Descobrir o melhor modelo (Resposta binária)

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes quando coletar dados, realizar a análise e interpretar seus resultados.

A variável resposta deve ser binária
A resposta binária tem dois resultados, como aprovação ou reprovação. Se sua variável resposta for contínua, use Descobrir o melhor modelo (Resposta contínua).
Os preditores podem ser contínuos ou categóricos

A variável contínua pode ser medida e ordenada, e tem um número infinito de valores entre dois valores quaisquer. Por exemplo, os diâmetros de uma amostra de pneus representam uma variável contínua.

As variáveis categóricas contêm um número finito e contável de categorias ou grupos distintos. Os dados categóricos podem não ter uma ordem lógica. Por exemplo, os preditores categóricos incluem gênero, tipo de material e método de pagamento.

Se você tem uma variável discreta, pode decidir se quer tratá-la como um preditor contínuo ou categórico. Uma variável discreta pode ser medida e ordenada mas tem um número contável de valores. Por exemplo, o número de pessoas que vivem em uma casa é uma variável discreta. A decisão de se tratar de uma variável contínua ou discreta como categórica depende do número de níveis, bem como da finalidade da análise. Para obter mais informações, acesse O que são variáveis categóricas, discretas e contínuas?.

É recomendável usar um conjunto de testes quando o número de casos for maior que 2000

Minitab usa validação cruzada para comparar os modelos quando o número de casos é ≤ 2000. Quando o número de casos é maior que 2000, o Minitab usa um conjunto de testes. Quando o conjunto de dados é grande, a validação com um conjunto de testes reduz o tempo para analisar os dados. Para obter mais informações sobre as configurações para técnicas de validação em Descobrir o melhor modelo (Resposta binária), acesse Especifique o método de validação para Descobrir o melhor modelo (Resposta binária).

O modelo deve fornecer um bom ajuste aos dados

Se o modelo não se ajustar aos dados, os resultados podem ser equivocados. Todos os tipos de modelos incluem estatísticas de resumo de modelos que descrevem o desempenho do modelo. Use os resultados da validação cruzada ou do conjunto de testes para determinar se o modelo prevê bem a resposta.