Exemplo de predição com Classificação Random Forests®

Observação

Este comando está disponível com o módulo complementar Análise preditiva. Clique aqui saber como ativar o módulo.

Uma equipe de pesquisadores coleta e publica informações detalhadas sobre fatores que afetam doenças cardíacas. As variáveis incluem idade, sexo, níveis de colesterol, frequência cardíaca máxima e muito mais. Este exemplo é baseado em um conjunto de dados públicos que fornece informações detalhadas sobre doenças cardíacas. Os dados originais são de archive.ics.uci.edu.

O pesquisador pode usar o modelo de árvore de classificação de floresta aleatória para predizer as probabilidades de classe de resposta para novas observações com grande exatidão.

  1. Conclua Exemplo de Classificação Random Forests®.
  2. Clique no botão Predizer na parte inferior dos resultados.
  3. Na lista suspensa, selecione Inserir valores individuais.
  4. Digite os seguintes valores. Você pode usar até três valores. É importante escolher valores que estejam dentro da amplitude dos dados originais.
    Idade 35 35  
    Pressão Arterial de descanso 140 140  
    Colesterol 233 233  
    Max Heart Rate 150 165  
    Pico Antigo 2,3 2,3  
    Sexo Masculino Feminino  
    Tipo de dor torácica 2 1  
    Açúcar no sangue em jejum Verdadeiro Verdadeiro  
    Resto ECG 0 1  
    Exercício Angina      
    Inclinação 1 3  
    Principais Navios 0 2  
    Thal Normal Normal  
  5. Clique em OK.

Interprete os resultados

O Minitab utiliza a árvore de classificação de floresta aleatótira nos resultados para estimar a probabilidade de classe de uma doença cardíaca para um conjunto de valores de predição. Os pesquisadores descobrem que a probabilidade de um evento de diagnóstico de doença cardíaca usando as configurações especificadas é de aproximadamente 0,83 para o primeiro conjunto e 0,62 para o segundo conjunto.

Classificação Random Forests®: Doença cardí vs Idade; Pressão Arte; ...

Método Validação do modelo Validação com dados usando método out-of-bag Número de amostras bootstrap 300 Tamanho amostral: O mesmo que o tamanho dos dados de treinamento de 303 Número de preditores selecionados para divisão de nós Raiz quadrada do número total de preditores = 3 Tamanho mínimo do nó interno 2 Linhas usadas 303
Informações de resposta binária Variável Classe Contagem % Doença cardíaca Sim (Evento) 139 45,87 Não 164 54,13 Tudo 303 100,00
Predizer... Previsão de classificação Random Forests®

Predição para Doença cardíaca

Configurações Idade = 35; Pressão Arterial de descanso = 140; Colesterol = 233; Max Heart Rate = 150; Pico Antigo = 2,3; Sexo = Masculino; Tipo de dor torácica = 2; Açúcar no sangue em jejum = Verdade; Resto ECG = 0; Exercício Angina = ""; Inclinação = 1; Principais Navios = 0; Thal = Normal
Predição Prob Prob (classe (classe Obs. Classe = Sim) = Não) 1 Não 0,17 0,83

Predição para Doença cardíaca

Configurações Idade = 35; Pressão Arterial de descanso = 140; Colesterol = 233; Max Heart Rate = 165; Pico Antigo = 2,3; Sexo = Fêmea; Tipo de dor torácica = 1; Açúcar no sangue em jejum = Verdade; Resto ECG = 1; Exercício Angina = ""; Inclinação = 3; Principais Navios = 2; Thal = Normal
Predição Prob (classe Prob (classe Obs. Classe = Sim) = Não) 2 Não 0,383333 0,616667