Tabela de métodos para Regressão MARS®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Encontre definições e orientações de interpretação para a tabela Método.

Critério para selecionar o melhor modelo

O critério que Regressão MARS® usa para criar o modelo. Regressão MARS® usa o máximo R-quadrado (padrão) ou o menor desvio absoluto médio para selecionar o melhor modelo. O critério de desvio absoluto médio tenta diminuir a influência dos pontos com os piores ajustes em relação ao critério R-quadrado.

Validação do modelo

Regressão MARS® usa o método de validação cruzada ou um conjunto de testes separado para validar o modelo. Com a validação cruzada, você pode especificar as linhas para cada dobra ou permitir uma seleção aleatória. Com um conjunto de testes separado, você pode especificar as linhas para os conjuntos de treinamento e teste ou permitir uma seleção aleatória.

Número máximo de funções base

A análise ajusta esse número de funções de base antes de usar a eliminação inversa de funções de base para selecionar o melhor modelo. O valor padrão é de 30. Valores maiores indicam que a análise fez uma busca mais minuciosa pelo modelo ideal.

Número mínimo de observações entre nós

Um nó é um ponto de dados onde as funções de base mudam. Por padrão, a análise usa o tamanho da amostra e a complexidade do modelo para selecionar automaticamente um número mínimo. Caso contrário, a tabela exibe o número específico para a análise. Um valor de 1 indica que pontos de dados consecutivos são elegíveis para serem pontos em que a função de base é alterada. O valor de 1 permite as mudanças mais rápidas nas previsões do modelo. Considere valores diferentes para ver o efeito no ajuste do modelo. Por exemplo, para alguns dados, valores maiores criam modelos mais suaves com menor probabilidade de sobreajustar os dados de treinamento. Esses modelos mais suaves às vezes são menos precisos em certos intervalos dos dados.

Linhas usadas

O número de observações de resposta presentes na análise que ajusta e avalia o modelo.

Linhas não usadas

O número de observações de resposta faltantes. Isso também inclui valores faltantes ou zeros na coluna de peso.