Tabela Sumário do modelo para Regressão MARS^®

Para determinar quão bem o modelo se ajusta aos seus dados, examine as estatísticas na tabela Resumo do modelo.

Preditores totais

O número total de preditores disponíveis para o modelo. Esta é a soma dos preditores contínuos e dos preditores categóricos especificados por você.

Preditores importantes

O número de preditores importantes no modelo. Preditores importantes são as variáveis que têm pelo menos 1 função de base no modelo.

Interpretação

Você pode usar o gráfico de Importância Relativa da Variável para exibir a ordem de importância relativa da variável. Por exemplo, suponha que 10 de 20 preditores tenham funções de base no modelo, o gráfico Importância da Variável Relativa exibe as variáveis em ordem de importância.

Número máximo de funções de base

O número de funções de base que o algoritmo constrói para procurar o modelo ideal.

Interpretação

Por padrão, o Minitab Statistical Software define o número máximo de funções de base como 30. Considere um valor maior quando 30 funções de base parecerem muito pequenas para os dados. Por exemplo, considere um valor maior quando você acredita que mais de 30 preditores são importantes.

Número ideal de funções de base

O número de funções de base no modelo ideal.

Interpretação

Depois que a análise estima o modelo com o número máximo de funções de base, a análise usa um procedimento de eliminação para trás para remover as funções de base do modelo. Uma a uma, a análise remove a função de base que menos contribui para o ajuste do modelo. Em cada etapa, a análise calcula o valor do critério de otimidade para a análise, seja R-quadrado ou desvio absoluto médio. Após a conclusão do procedimento de eliminação, o número ótimo de funções de base é o número do procedimento de eliminação que produz o valor ótimo do critério.

R-quadrado

R² é a porcentagem de variação na resposta que o modelo explica. Os outliers têm um efeito maior no R² do que no MAD e MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística R² para o conjunto de dados de treinamento e uma estatística R² para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste R² é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use o R² para determinar se o modelo ajusta bem seus dados. Quanto maior o valor R², melhor o modelo ajusta seus dados. R² está sempre entre 0% e 100%.

Você pode ilustrar graficamente o significado de diferentes valores de R². O primeiro gráfico ilustra um modelo de regressão simples que explica 85,5% da variação na resposta. O segundo gráfico ilustra um modelo que explica 22,6% da variação da resposta. Quanto mais variação for explicada pelo modelo, mais perto dos valores ajustados caem os pontos de dados. Teoricamente, se um modelo puder explicar 100% da variação, os valores ajustados sempre equivaleriam aos valores observados e todos os pontos de dados cairiam sobre a linha y = x.

Um teste R² substancialmente menor do que o R² de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Raiz do quadrado médio do erro (RMSE)

A raiz do quadrado médio do erro (RMSE) mede a exatidão do modelo. Os outliers exercem um efeito maior sobre o RMSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística RMSE para o conjunto de dados de treinamento e uma estatística RMSE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste RMSE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de modelos diferentes. Valores menores indicam um ajuste melhor. Um teste RMSE substancialmente menor do que o RMSE de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Erro quadrado médio (MSE)

O erro quadrado médio (MSE) mede a exatidão do modelo. Os outliers exercem um efeito maior sobre o MSE do que sobre o MAD e o MAPE.

Quando você usa um método de validação, a tabela inclui uma estatística MSE para o conjunto de dados de treinamento e uma estatística MSE para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste MSE é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de modelos diferentes. Valores menores indicam um ajuste melhor. Um teste MSE substancialmente menor do que o MSE de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Desvio absoluto médio (MAD)

O desvio absoluto médio (MAD) expressa exatidão nas mesmas unidades que os dados, o que ajuda a conceituar a quantidade de erro. Os outliers têm menos efeito sobre o DAM do que sobre o R², RMSE e MSE.

Quando você usa um método de validação, a tabela inclui uma estatística MAD para o conjunto de dados de treinamento e uma estatística MAD para o conjunto de dados de teste. Quando o método de validação é uma validação cruzada de K duplicações, o conjunto de dados de teste é cada duplicação quando a construção do modelo exclui essa duplicação. Normalmente, a estatística do teste DAM é uma medida melhor de como o modelo funciona para novos dados.

Interpretação

Use para comparar os ajustes de modelos diferentes. Valores menores indicam um ajuste melhor. Um teste DAM substancialmente menor do que o DAM de treinamento indica que o modelo pode não predizer os valores de resposta para novos casos tão bem quanto o modelo ajusta o conjunto de dados atual.

Tabela Sumário do modelo para Regressão MARS®

Preditores totais

Preditores importantes

Interpretação

Número máximo de funções de base

Interpretação

Número ideal de funções de base

Interpretação

R-quadrado

Interpretação

Raiz do quadrado médio do erro (RMSE)

Interpretação

Erro quadrado médio (MSE)

Interpretação

Desvio absoluto médio (MAD)

Interpretação

Tabela Sumário do modelo para Regressão MARS^®