Exemplo de predição com Descobrir o melhor modelo (Resposta binária)

Observação

Este comando está disponível com o Módulo de análise preditiva. Clique aqui saber mais sobre como ativar o módulo.

Uma equipe de pesquisadores coleta e publica informações detalhadas sobre fatores que afetam doenças cardíacas. As variáveis incluem idade, sexo, níveis de colesterol, frequência cardíaca máxima e muito mais. Este exemplo é baseado em um conjunto de dados públicos que fornece informações detalhadas sobre doenças cardíacas. Os dados originais são de archive.ics.uci.edu.

O pesquisador pode usar o modelo de árvore de classificação de floresta aleatória para predizer as probabilidades de classe de resposta para novas observações.

  1. Conclua Exemplo de Descobrir o melhor modelo (Resposta binária).
  2. No Navegador, selecione os resultados para Descobrir o melhor modelo (Resposta binária)/.
  3. Clique no botão Predizer na parte inferior dos resultados.
  4. Na lista suspensa, selecione Inserir valores individuais.
  5. Digite os seguintes valores. Este exemplo usa 2 valor para cada preditor, mas você pode usar até 3 valores. Este exemplo também usa intencionalmente valores faltantes para Exercício Angina.
    Idade 35 35  
    Pressão Arterial de descanso 140 140  
    Colesterol 233 233  
    Max Heart Rate 150 165  
    Pico Antigo 2,3 2,3  
    Sexo 0 1  
    Tipo de dor torácica 2 1  
    Açúcar no sangue em jejum 1 1  
    Resto ECG 0 1  
    Exercício Angina      
    Inclinação 1 2  
    Principais Navios 0 2  
    Thal 0 0  
  6. Clique em OK.

Interprete os resultados

O Minitab usa o modelo Random Forests® nos resultados para estimar a probabilidade de classe de um evento de diagnóstico de doença cardíaca para os dois conjuntos de valores de predição. Os pesquisadores descobrem que a probabilidade de um evento de diagnóstico de doença cardíaca usando as configurações especificadas é de aproximadamente 0,63 para o primeiro conjunto e 0,52 para o segundo conjunto.

Classificação Random Forests®: Doença cardí vs Idade; Pressão Arte; ...

Método Validação do modelo Validação com dados usando método out-of-bag Número de amostras bootstrap 300 Tamanho amostral O mesmo que o tamanho dos dados de treinamento de 303 Número de preditores selecionados para divisão de nós Raiz quadrada do número total de preditores = 3 Tamanho mínimo do nó interno 8 Linhas usadas 303
Informações de resposta binária Variável Classe Contagem % Doença cardíaca 1 (Evento) 165 54,46 0 138 45,54 Tudo 303 100,00

Previsão de classificação Random Forests®

Predição para Doença cardíaca

Configurações Idade = 35; Pressão Arterial de descanso = 140; Colesterol = 233; Max Heart Rate = 150; Pico Antigo = 2,3; Sexo = 0; Tipo de dor torácica = 2; Açúcar no sangue em jejum = 1; Resto ECG = 0; Exercício Angina = *; Inclinação = 1; Principais Navios = 0; Thal = 0
Predição Prob (classe Prob (classe Obs. Classe = 1) = 0) 1 1 0,626667 0,373333

Predição para Doença cardíaca

Configurações Idade = 35; Pressão Arterial de descanso = 140; Colesterol = 233; Max Heart Rate = 165; Pico Antigo = 2,3; Sexo = 1; Tipo de dor torácica = 1; Açúcar no sangue em jejum = 1; Resto ECG = 1; Exercício Angina = *; Inclinação = 2; Principais Navios = 2; Thal = 0
Predição Prob (classe Prob (classe Obs. Classe = 1) = 0) 2 1 0,516667 0,483333