Módulo de análise
preditiva > Regressão
Logística Binária > Validação
Escolha o método de validação para testar seu modelo. Normalmente, com amostras menores, o método de validação cruzada de K dobras é apropriado. Com amostras maiores, você pode selecionar uma fração de casos para usar no treinamento e nos testes.
Complete as seguintes etapas para usar a validação cruzada de K dobras.
Na lista suspensa, selecione Validação cruzada de K dobras.
Escolha um dos procedimentos a seguir para especificar se a atribuição de dobras será feita aleatoriamente ou com uma coluna de ID.
Atribuir
aleatoriamente linhas de cada dobras: Selecione esta opção para fazer com que o Minitab selecione aleatoriamente as linhas para cada dobra. Você pode especificar o número de dobras. O valor padrão de 10 funciona bem na maioria dos casos. Usar um valor menor de K pode introduzir um viés ainda maior; contudo, valores maiores de K podem introduzir mais variabilidade. Também é possível definir uma base para o gerador de números aleatórios.
Atribuir linhas
de cada duplicação por coluna de ID: Selecione esta opção para escolher as linhas a serem incluídas em cada dobra. Em Coluna de
IDs, digite a coluna que identifica as dobras. Cada linha com o mesmo valor na coluna ID está na mesma dobra.
(Opcional) Selecione Armazenar a coluna de IDs para a validação
cruzada de K dobras para salvar a coluna ID.
Validação com um conjunto de testes
Conclua as etapas a seguir para dividir os dados em um conjunto de dados de treinamento e um conjunto de dados de teste.
Na lista suspensa, selecione Validação com um conjunto de testes.
Selecione uma das opções a seguir para determinar se selecionará uma fração de linhas aleatoriamente ou com uma coluna de ID.
Selecionar
aleatoriamente uma fração de linhas como um conjunto de teste: Selecione esta opção para fazer com que o Minitab selecione aleatoriamente o conjunto de dados de teste. Você pode especificar a quantidade de dados a serem usados no conjunto de dados de teste. O valor padrão de 0,3 funciona bem na maioria dos casos. Você deseja incluir dados suficientes no conjunto de dados de teste para avaliar bem o modelo. Se você não tem certeza sobre a forma do modelo, um conjunto de dados de teste maior proporcionará uma validação mais sólida. Você também deseja ter dados suficientes no conjunto de dados de treinamento para ter uma boa estimativa do modelo. Normalmente, modelos com mais preditores exigem a estimativa de mais dados de treinamento.
Definir a
divisão de treinamento/teste por coluna IDs: Selecione esta opção para escolher você mesmo as linhas a serem incluídas na amostra de teste. Em Coluna de
IDs, digite a coluna que indica quais linhas devem ser usadas para a amostra de teste. A coluna ID deve conter apenas 2 valores. Em Nível para
conjunto de teste, selecione qual nível deve ser usado como amostra de teste.
(Opcional) Verifique Armazenar
a coluna de IDs para a divisão de treinamento/teste para salvar a coluna ID.