Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.
Uma equipe de pesquisadores coleta dados da venda de propriedades residenciais individuais em Ames, Iowa. Os pesquisadores querem identificar as variáveis que afetam o preço de venda. As variáveis incluem o tamanho do lote e várias características do imóvel residencial.
Após a exploração inicial com Regressão CART® para identificar os preditores importantes, a equipe usa Regressão Random Forests® para criar um modelo mais intensivo a partir do mesmo conjunto de dados. Os equipe compara a tabela de sumário do modelo e o gráfico R2 dos resultados para avaliar qual modelo proporciona um resultado de predição melhor.
Esses dados foram adaptados com base em um conjunto de dados públicos contendo informações sobre os dados habitacionais de Ames. Dados originais de DeCock, Truman State University.
Validação do modelo | Validação com dados usando método out-of-bag |
---|---|
Número de amostras bootstrap | 300 |
Tamanho amostral | O mesmo que o tamanho dos dados de treinamento de 2930 |
Número de preditores selecionados para divisão de nós | 30% do número total de preditores = 23 |
Tamanho mínimo do nó interno | 5 |
Linhas usadas | 2930 |
Média | DesvPad | Mínimo | Q1 | Mediana | Q3 | Máximo |
---|---|---|---|---|---|---|
180796 | 79886,7 | 12789 | 129500 | 160000 | 213500 | 755000 |
Preditores totais | 77 |
---|---|
Preditores importantes | 68 |
Estatísticas | Out-of-Bag |
---|---|
R-quadrado | 90,90% |
Raiz do quadrado médio do Erro (RMSE) | 24097,3281 |
Quadrado médio do erro (MSE) | 5,80681E+08 |
Desvio absoluto médio (DAM) | 14746,8323 |
Erro percentual absoluto médio (MAPE) | 0,0895 |
A tabela de resumo do modelo mostra que os valores de R2 são ligeiramente melhorados em relação aos valores de R2 da análise CART® correspondente.