Consideraciones acerca de los datos para Clasificación Random Forests®

Nota

Este comando está disponible con el módulo Módulo de análisis predictivo. Haga clic aquí para obtener más información sobre cómo activar el módulo.

Para asegurarse de que los resultados sean válidos, tenga en cuenta las siguientes directrices al recopilar datos, realizar el análisis e interpretar los resultados.

La variable de respuesta debe ser categórica
Las variables categóricas contienen un número finito y contable de categorías o grupos distintos. Los datos categóricos pueden o no tener un orden lógico. Por ejemplo, las variables categóricas pueden ser sexo, tipo de material y método de pago.
  • Si la variable de respuesta tiene dos categorías, como pasa y no pasa, la respuesta es binaria.
  • Si la variable de respuesta contiene tres o más categorías, la respuesta es multinomial.

Los datos de la variable de respuesta deben ser valores de texto o valores numéricos. No se permiten valores de fecha/hora.

Si la variable de respuesta es continua, utilice Regresión Random Forests®.

Las variables predictoras pueden ser continuas o categóricas
Puede utilizar una combinación de predictores continuos o categóricos; sin embargo, las columnas de cada predictor deben tener la misma extensión que la columna de respuesta. Se permiten valores faltantes.
  • Todos los predictores continuos deben ser numéricos.
  • Los predictores categóricos pueden ser valores de texto o numéricos.