Gráfico da importância relativa da variável para Regressão Random Forests®

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

O gráfico de importância relativa da variável representa os preditores por ordem de seu efeito sobre a melhoria do modelo quando as divisões são feitas em um preditor sobre a floresta inteira. A variável com maior pontuação de melhoria é definida como a variável mais importante, e as outras variáveis seguem em ordem de importância. A importância relativa da variável padroniza os valores de importância para proporcionar facilidade de interpretação. A importância relativa é definida como a melhoria percentual em relação ao preditor mais importante, o quem uma importância de 100%.

A importância relativa é calculada pela divisão da pontuação da importância de cada variável pelo maior escore de importância das variáveis; em seguida, multiplicamos por 100%.

Interpretação

Os valores da importância relativa da variável variam de 0% a 100%. A variável mais importante sempre tem uma importância relativa de 100%. Se uma variável não é utilizada no modelo, não é importante.

A variável preditora mais importante para predizer o preço de venda é Quality. Se a contribuição da variável preditora superior, Qualidade, for de 100%, então a próxima variável importante, Living Area SF, tem uma contribuição de 88,8%. Isso significa que a área da casa é 88,8% tão importante quanto a qualidade geral da propriedade. A próxima variável mais importante é a Neighborhood, que tem uma contribuição de 52,6%.