Exemplo de predição com Classificação CART®

Uma equipe de pesquisadores coleta e publica informações detalhadas sobre fatores que afetam doenças cardíacas. As variáveis incluem idade, sexo, níveis de colesterol, frequência cardíaca máxima e muito mais. Este exemplo é baseado em um conjunto de dados públicos que fornece informações detalhadas sobre doenças cardíacas. Os dados originais são de archive.ics.uci.edu.

No exemplo da criação de árvores, os pesquisadores criaram uma árvore de classificação que identifica preditores importantes para indicar se um paciente tem doença cardíaca. Os pesquisadores querem fazer predições com esta árvore.

  1. Completa Exemplo de Classificação CART®.
  2. Clique no botão Predição na parte inferior dos resultados da árvore de classificação.
  3. Na lista suspensa, selecione Inserir valores individuais.
  4. Digite os seguintes valores. Este exemplo usa 2 valores para cada preditor. É importante escolher valores que estejam dentro da amplitude dos dados originais. Este exemplo usa 2 valores para cada preditor, de modo que a terceira coluna permanece vazia.
    Idade 35 35  
    Pressão Arterial de descanso 140 140  
    Colesterol 233 233  
    Max Heart Rate 150 165  
    Pico Antigo 2,3 2,3  
    Sexo Masculino Feminino  
    Tipo de dor torácica 2 1  
    Açúcar no sangue em jejum Verdadeiro Verdadeiro  
    Resto ECG 0 1  
    Exercício Angina      
    Inclinação 1 3  
    Principais Navios 0 2  
    Thal Normal Normal  
  5. Clique em OK.

Interprete os resultados

O Minitab utiliza a árvore de classificação nos resultados para estimar a probabilidade de classe para os 2 conjuntos de valores de predição.
  • Para o primeiro conjunto de valores de predição, as configurações são as mesmas das configurações do Nó Terminal 1. A predição da classe é Não. A probabilidade de Não é 0,91, e a probabilidade para Sim é 0,09.
  • Para o segundo conjunto de valores de predição, as configurações são as mesmas das configurações do Nó Terminal 4. A predição da classe é Sim. A probabilidade para Sim é de aproximadamente 0,74, e a probabilidade para Não é de aproximadamente 0,26.

Classificação CART® de 7 nós: Doença cardíaca versus Idade; Pressão Arterial de descanso; Colesterol; Max Heart Rate; Pico Antigo; Sexo; Açúcar no sangue em jejum; Exercício Angina; Resto ECG; Inclinação; Thal; Tipo de dor torácica; Principais Navios

Método Probabilidades a priori Mesmo para todas as classes Divisão de nós Gini Árvore ótima Custo mínimo de classificação errada Validação do modelo Validação cruzada de 10 dobras Linhas usadas 303

Predição de classificação CART®

Predição para Doença cardíaca

Configurações Idade = 35; Pressão Arterial de descanso = 140; Colesterol = 233; Max Heart Rate = 150; Pico Antigo = 2,3; Sexo = Masculino; Tipo de dor torácica = 2; Açúcar no sangue em jejum = Verdade; Resto ECG = 0; Exercício Angina = ""; Inclinação = 1; Principais Navios = 0; Thal = Normal
Predição Prob Prob ID de nó (classe (classe Obs. terminal Classe = Sim) = Não) 1 1 Não 0,09 0,91

Predição para Doença cardíaca

Configurações Idade = 35; Pressão Arterial de descanso = 140; Colesterol = 233; Max Heart Rate = 165; Pico Antigo = 2,3; Sexo = Fêmea; Tipo de dor torácica = 1; Açúcar no sangue em jejum = Verdade; Resto ECG = 1; Exercício Angina = ""; Inclinação = 3; Principais Navios = 2; Thal = Normal
Predição ID de nó Prob (classe Prob (classe Obs. terminal Classe = Sim) = Não) 2 4 Sim 0,740741 0,259259