Considerações de dados para Descobrir o melhor modelo (Resposta contínua)

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes quando coletar dados, realizar a análise e interpretar seus resultados.

A variável resposta deve ser contínua
A variável contínua pode ser medida e ordenada, e tem um número infinito de valores entre dois valores quaisquer. Por exemplo, os diâmetros de uma amostra de pneus representam uma variável contínua.

Os dados da variável resposta devem ser valores numéricos.

Se sua variável resposta for categórica, use Descobrir o melhor modelo (Resposta binária).

As variáveis preditoras podem ser contínuas ou categóricas
Você pode usar uma combinação de preditores contínuos ou categóricos; no entanto, os comprimentos da coluna para cada preditor devem ser iguais aos da coluna de resposta. Não são permitidos valores faltantes.
  • Todos os preditores contínuos devem ser numéricos.
  • Os preditores categóricos podem se valores de texto ou numéricos.
É recomendável usar um conjunto de testes quando o número de casos for maior que 2000

Minitab usa validação cruzada para comparar os modelos quando o número de casos é ≤ 2000. Quando o número de casos é maior que 2000, o Minitab usa um conjunto de testes. Quando o conjunto de dados é grande, a validação com um conjunto de testes reduz o tempo para analisar os dados. Para obter mais informações sobre as configurações para técnicas de validação em Descobrir o melhor modelo (Resposta contínua), acesse Especifique o método de validação para Descobrir o melhor modelo (Resposta contínua).

O modelo deve fornecer um bom ajuste aos dados.

Se o modelo não se ajustar aos dados, os resultados podem ser equivocados. Todos os tipos de modelos incluem estatísticas de resumo de modelos que descrevem o desempenho do modelo. Use os resultados da validação cruzada ou do conjunto de testes para determinar se o modelo prevê bem a resposta. Na saída para um modelo de regressão, também utilize as parcelas residuais para verificar se as suposições paramétricas se mantêm.