Ejemplo de predicción con Descubrir el mejor modelo (Respuesta binaria)

Nota

Este comando está disponible con el módulo Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Un equipo de investigadores recopila y publica información detallada sobre los factores que afectan las enfermedades cardíacas. Las variables incluyen edad, sexo, niveles de colesterol, frecuencia cardíaca máxima, y más. Este ejemplo se basa en un conjunto de datos públicos que proporciona información detallada sobre las enfermedades cardíacas. Los datos originales son de archive.ics.uci.edu.

El investigador puede utilizar el modelo de árboles de clasificación Random Forest para predecir las probabilidades de clase de respuesta para nuevas observaciones.

  1. Complete el Ejemplo de Descubrir el mejor modelo (Respuesta binaria).
  2. En el Navegador, seleccione los resultados de Descubrir el mejor modelo (Respuesta binaria).
  3. Haga clic en el botón Predecir al final de los resultados.
  4. En la lista desplegable, seleccione Ingresar valores individuales.
  5. Ingrese los siguientes valores. En este ejemplo se utilizan 2 valores para cada predictor, pero usted puede utilizar hasta 3 valores. En este ejemplo también se utilizan intencionadamente los valores faltantes de Ejercicio Angina.
    Edad 35 35  
    Descansar la presión arterial 140 140  
    Colesterol 233 233  
    Frecuencia cardíaca máxima 150 165  
    Old Peak 2.3 2.3  
    Sexo 0 1  
    Tipo de dolor torácico 2 1  
    Azúcar en la sangre en ayunas 1 1  
    Rest ECG 0 1  
    Ejercicio Angina      
    Pendiente 1 2  
    Buques principales 0 2  
    Thal 0 0  
  6. Haga clic en Aceptar.

Interpretar los resultados

Minitab utiliza el modelo Random Forest® en los resultados para estimar la probabilidad de clase de un evento de diagnóstico de enfermedad cardíaca para los dos conjuntos de valores de predicción. Los investigadores encuentran que la probabilidad de un evento de diagnóstico de enfermedad cardíaca utilizando la configuración especificada es aproximadamente 0.63 para el primer conjunto y 0.52 para el segundo conjunto.

Clasificación Random Forests®: Enfermedad c vs Edad, Descansar la, ...

Método Validación del modelo Validación con datos de "out-of-bag" Número de muestras de bootstrap 300 Tamaño de la muestra Igual que el tamaño de los datos de entrenamiento de 303 Número de predictores seleccionados para la división de nodos Raíz cuadrada del número total de predictores = 3 Tamaño mínimo del nodo interno 8 Filas utilizadas 303
Información de respuesta binaria Variable Clase Conteo % Enfermedad cardíaca 1 (Evento) 165 54.46 0 138 45.54 Todo 303 100.00

Predicción de Clasificación Random Forests®

Predicción para Enfermedad cardíaca

Configuración Edad = 35, Descansar la presión arterial = 140, Colesterol = 233, Frecuencia cardíaca máxima = 150, Old Peak = 2.3, Sexo = 0, Tipo de dolor torácico = 2, Azúcar en la sangre en ayunas = 1, Rest ECG = 0, Ejercicio Angina = *, Pendiente = 1, Buques principales = 0, Thal = 0
Predicción Prob. Prob. Obs Clase (Clase = 1) (Clase = 0) 1 1 0.626667 0.373333

Predicción para Enfermedad cardíaca

Configuración Edad = 35, Descansar la presión arterial = 140, Colesterol = 233, Frecuencia cardíaca máxima = 165, Old Peak = 2.3, Sexo = 1, Tipo de dolor torácico = 1, Azúcar en la sangre en ayunas = 1, Rest ECG = 1, Ejercicio Angina = *, Pendiente = 2, Buques principales = 2, Thal = 0
Predicción Prob. Prob. Obs Clase (Clase = 1) (Clase = 0) 2 1 0.516667 0.483333