Uma equipe de pesquisadores coleta e publica informações detalhadas sobre fatores que afetam doenças cardíacas. As variáveis incluem idade, sexo, níveis de colesterol, frequência cardíaca máxima e muito mais. Este exemplo é baseado em um conjunto de dados públicos que fornece informações detalhadas sobre doenças cardíacas. Os dados originais são de archive.ics.uci.edu.
Os pesquisadores querem criar uma árvore de classificação que identifique preditores importantes a fim de indicar se um paciente tem doença cardíaca.
Escolha Módulo de análise
preditiva > Classificação
CART®.
Na lista suspensa, selecione Resposta
binária.
Em Resposta, digite Doença cardíaca.
Em Evento de
resposta, selecione Sim para indicar que a doença cardíaca foi identificada no paciente.
Em Preditores contínuos, digite Idade, Pressão Arterial de descanso, Colesterol, Max Heart Rate, e Pico Antigo.
Em Preditores categóricos, digite Sexo, Tipo de dor torácica, Açúcar no sangue em jejum, Resto ECG, Exercício Angina, Inclinação, Principais Navios, e Thal.
Clique em OK.
Interpretar os resultados
Por padrão, o Minitab exibe a menor árvore com um custo de classificação errada dentro de 1 erro padrão da árvore que minimiza o custo de classificação errada. Esta árvore tem 4 nós terminais.
Antes de os pesquisadores examinarem a árvore, eles analisam o gráfico que mostra o custo de classificação errada da validação cruzada e o número de nós terminais. Neste gráfico, o padrão em que o custo de classificação errada diminui continua após a árvore de 4 nós. Em um caso como este, os analistas optam por explorar algumas das outras árvores simples que têm menores custos de classificação errada.
Selecione uma árvore alternativa
Na saída, clique em Selecionar uma árvore alternativa
No gráfico, selecione a árvore de 7 nós que tenha o menor custo de classificação e o melhor valor de ROC.
Clique em Criar
árvore.
Interpretar os resultados
No diagrama da árvore, itens que são azuis são para o nível do evento. Os itens em vermelho são para o nível não evento. Nesta saída, o nível do evento é "Sim" e indica que alguém tem doença cardíaca. O nível de não evento é "Não" e indica que alguém não tem doença cardíaca.
No nó raiz, há 139 contagens do evento Sim e 164 contagens do evento Não. O nó raiz é dividido usando a variável, THAL. Quando THAL = Normal, vá para o nó esquerdo (Nó 2). Quando THAL = Fixo ou Reversível, vá para o nó direito (Nó 5).
Nó 2: Há 167 casos em que o THAL era Normal. Dos 167 casos, 38 ou 22,8% são Sim e 129 ou 77,2% são Não.
Nó 5: Há 136 casos em que o THAL era Fixo ou Reversível. Dos 136 casos, 101 ou 74,3% são Sim e 35 ou 25,7% são Não.
O próximo divisor para o nó filho esquerdo e o nó filho direito é o Tipo dor no peito, em que a dor é classificada como 1, 2, 3 ou 4.
Explore outros nós para ver quais são as variáveis mais interessantes. Os nós que são majoritariamente azuis indicam uma forte proporção do nível de evento. Os nós que são majoritariamente vermelhos indicam uma forte proporção do nível de não evento.
Classificação CART® de 7 nós: Doença cardíaca versus Idade; Pressão Arterial de descanso; Colesterol; Max Heart Rate; Pico Antigo; Sexo; Açúcar no sangue em jejum; Exercício Angina; Resto ECG; Inclinação; Thal; Tipo de dor torácica; Principais Navios