Gráfico da importância relativa da variável para Regressão CART®

Use o gráfico da importância relativa da variável para ver quais preditores são as variáveis mais importantes para a árvore.

A importância relativa da variável padroniza os valores de importância para proporcionar facilidade de interpretação. A importância relativa é definida como a melhoria percentual em relação ao preditor mais importante.

Uma variável importante é aquela usada como um divisor principal ou substituto na árvore. A variável com maior pontuação de melhoria é definida como a variável mais importante, e as outras variáveis são classificadas de acordo. A importância relativa da variável padroniza os valores de importância para proporcionar facilidade de interpretação. A importância relativa é definida como a melhoria percentual em relação ao preditor mais importante.

A importância relativa é calculada pela divisão da pontuação da importância de cada variável pelo maior escore de importância das variáveis; em seguida, multiplicado por 100%.

Interpretação

Os valores da importância relativa da variável variam de 0% a 100%. A variável mais importante sempre tem uma importância relativa de 100%. Se uma variável não é utilizada na árvore, não é importante.

Neste exemplo, a variável preditora mais importante é Uso de Álcool. Se a contribuição da variável preditor mais importante, Uso de Álcool, é de 100%, então você pode comparar as outras variáveis a Uso de Álcool para determinar sua importância. Assim, você pode se concentrar nos preditores mais importantes. A lista a seguir descreve as próximas variáveis mais importantes nesta árvore.
  • Substância Primária do Abuso e Terapia de Medicação Planejada são cerca de 92% tão importantes quanto Uso de Álcool.
  • Uso de heroína é cerca de 55% tão importante quanto Uso de Álcool.
  • Rota de Ingestion Primária de Sub e Fonte de referência são cerca de 48% tão importantes quanto Uso de Álcool.

Embora esses resultados incluam 33 variáveis com importância positiva, os rankings relativos fornecem informações sobre quantas variáveis devem ser controladas ou monitoradas para uma determinada aplicação. Quedas íngremes nos valores de importância relativa de uma variável para a próxima variável podem orientar as decisões sobre quais variáveis devem ser controladas ou monitoradas. Por exemplo, nesses dados, as três variáveis mais importantes têm valores de importância relativamente próximos antes de uma queda de quase 40% na importância relativa para a próxima variável. Da mesma forma, três variáveis têm valores de importância semelhantes próximos a 50%. Você pode remover variáveis de diferentes grupos e refazer a análise para avaliar como as variáveis em vários grupos afetam os valores de exatidão da predição na tabela Sumário do modelo.