Preditores totais | 77 |
---|---|
Preditores importantes | 10 |
Número máximo de funções base | 30 |
Número ótimo de funções base | 13 |
Estatísticas | Treinamento | Teste |
---|---|---|
R-quadrado | 89,61% | 87,61% |
Raiz do quadrado médio do Erro (RMSE) | 25836,5197 | 27855,6550 |
Quadrado médio do erro (MSE) | 667525749,7185 | 775937512,8264 |
Desvio absoluto médio (MAD) | 17506,0038 | 17783,5549 |
Nestes resultados, o teste R-quadrado é de cerca de 88%. O erro quadrado médio da raiz de teste é de cerca de 27.856. O erro quadrado médio do teste é de cerca de 775.937.513. O desvio absoluto médio do teste é de cerca de 17.784.
Use o gráfico de importância da variável relativa para ver quais preditores são as variáveis mais importantes para o modelo.
Variáveis importantes estão em pelo menos 1 função base no modelo. A variável com maior pontuação de melhoria é definida como a variável mais importante e as outras variáveis são classificadas de acordo. A importância relativa da variável padroniza os valores de importância para facilitar a interpretação. A importância relativa é definida como a melhoria percentual em relação ao preditor mais importante.
Os valores de importância relativa da variável variam de 0% a 100%. A variável mais importante tem sempre uma importância relativa de 100%. Se uma variável não estiver em uma função base, essa variável não será importante.
Embora esses resultados incluam 10 variáveis com importância positiva, os rankings relativos fornecem informações sobre quantas variáveis devem ser controladas ou monitoradas para uma determinada aplicação. Quedas íngremes nos valores de importância relativa de uma variável para a próxima variável podem orientar as decisões sobre quais variáveis devem ser controladas ou monitoradas. Por exemplo, nesses dados, as 2 variáveis mais importantes têm valores de importância que estão relativamente próximos antes de uma queda de mais de 20% em importância relativa para a próxima variável. Da mesma forma, 2 variáveis têm valores de importância semelhantes acima de 60%. Você pode remover variáveis de diferentes grupos e refazer a análise para avaliar como as variáveis em vários grupos afetam os valores de exatidão da predição na tabela Sumário do modelo.
Use os gráficos de dependência parcial, as funções de base e os coeficientes na equação de regressão para determinar o efeito dos preditores. Os efeitos dos preditores explicam a relação entre os preditores e a resposta. Considere todas as funções de base para um preditor entender o efeito do preditor na variável de resposta.
Além disso, considere o uso dos preditores importantes e as formas de seus relacionamentos ao construir outros modelos. Por exemplo, se o modelo de regressão MARS® incluir interações, considere se essas interações devem ser incluídas em um modelo de regressão de mínimos quadrados para comparar o desempenho dos dois tipos de modelos. Em aplicativos em que você controla os preditores, os efeitos fornecem uma maneira natural de otimizar as configurações para atingir uma meta para a variável de resposta.
Em um modelo aditivo, gráficos de dependência parcial de um preditor mostram como os importantes preditores contínuos afetam a resposta prevista. O gráfico de dependência parcial com um preditor indica como a resposta deve mudar com modificações nos níveis do preditor. Para Regressão MARS®, os valores no gráfico vêm das funções de base para o preditor no eixo x. A contribuição no eixo y é padronizada de modo que o valor mínimo no gráfico seja 0.
Este gráfico ilustra que aumenta à medida que Preço de venda aumenta Área de convivência da metragem quadrada mínima no conjunto de dados para cerca de 3.000 pés quadrados. Depois de Área de convivência atingir 3.000 pés quadrados, a contribuição para se torna plana Preço de venda em aproximadamente US $ 152.000.
Nesses resultados, o BF2 apresenta coeficiente negativo na equação de regressão. O coeficiente para a função base é −57,6167. O arranjo da função base é max(0, c − X). Nesse arranjo, o valor da função base diminui quando o preditor aumenta. A combinação desse arranjo com o coeficiente negativo cria uma relação positiva entre a variável preditora e a variável resposta. A inclinação de é de 57,6167 de Área de convivência 438 para 3.078.
Para obter mais exemplos de funções de base comum, vá para Equação de regressão para Regressão MARS®.