Tabela Sumário do modelo para Regressão MARS®

Para determinar quão bem o modelo se ajusta aos seus dados, examine as estatísticas na tabela Resumo do modelo.

Preditores totais

O número total de preditores disponíveis para o modelo. Esta é a soma dos preditores contínuos e dos preditores categóricos especificados por você.

Preditores importantes

O número de preditores importantes no modelo. Preditores importantes são as variáveis que têm pelo menos 1 função de base no modelo.

Interpretação

Você pode usar o gráfico de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 de 20 preditores tenham funções de base no modelo, o gráfico Importância da Variável Relativa exibe as variáveis em ordem de importância.

Número máximo de funções de base

O número de funções de base que o algoritmo constrói para procurar o modelo ideal.

Interpretação

Por padrão, o Minitab Statistical Software define o número máximo de funções de base como 30. Considere um valor maior quando 30 funções de base parecerem muito pequenas para os dados. Por exemplo, considere um valor maior quando você acredita que mais de 30 preditores são importantes.

Número ideal de funções de base

O número de funções de base no modelo ideal.

Interpretação

Depois que a análise estima o modelo com o número máximo de funções de base, a análise usa um procedimento de eliminação para trás para remover as funções de base do modelo. Uma a uma, a análise remove a função de base que menos contribui para o ajuste do modelo. Em cada etapa, a análise calcula o valor do critério de otimidade para a análise, seja R-quadrado ou desvio absoluto médio. Após a conclusão do procedimento de eliminação, o número ótimo de funções de base é o número do procedimento de eliminação que produz o valor ótimo do critério.

R-quadrado

R2 é a porcentagem de variação na resposta que o modelo explica. Os outliers têm um efeito maior no R2 do que no MAD e MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística R2 para o conjunto de dados de treinamento e uma estatística R2 para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste R2 é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use o R2 para determinar se o modelo ajusta bem seus dados. Quanto maior o valor R2, melhor o modelo ajusta seus dados. R2 está sempre entre 0% e 100%.

Você pode ilustrar graficamente o significado de diferentes valores de R2. O primeiro gráfico ilustra um modelo de regressão simples que explica 85,5% da variação na resposta. O segundo gráfico ilustra um modelo que explica 22,6% da variação da resposta. Quanto mais variação for explicada pelo modelo, mais perto dos valores ajustados caem os pontos de dados. Teoricamente, se um modelo puder explicar 100% da variação, os valores ajustados sempre equivaleriam aos valores observados e todos os pontos de dados cairiam sobre a linha y = x.

Um teste R2 substancialmente menor do que o R2 de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Raiz do quadrado médio do erro (RMSE)

A raiz do quadrado médio do erro (RMSE) mede a exatidão do modelo. Os outliers exercem um efeito maior sobre o RMSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística RMSE para o conjunto de dados de treinamento e uma estatística RMSE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste RMSE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de modelos diferentes. Valores menores indicam um ajuste melhor. Um teste RMSE substancialmente menor do que o RMSE de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Erro quadrado médio (MSE)

O erro quadrado médio (MSE) mede a exatidão do modelo. Os outliers exercem um efeito maior sobre o MSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística MSE para o conjunto de dados de treinamento e uma estatística MSE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste MSE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de modelos diferentes. Valores menores indicam um ajuste melhor. Um teste MSE substancialmente menor do que o MSE de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Desvio absoluto médio (MAD)

O desvio absoluto médio (MAD) expressa exatidão nas mesmas unidades que os dados, o que ajuda a conceituar a quantidade de erro. Os outliers têm menos efeito sobre o DAM do que sobre o R2, RMSE e MSE.

Quando você usa um método de validação, a tabela inclui uma estatística MAD para o conjunto de dados de treinamento e uma estatística MAD para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste DAM é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de modelos diferentes. Valores menores indicam um ajuste melhor. Um teste DAM substancialmente menor do que o DAM de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.