Para asegurar que los resultados sean válidos, considere las siguientes pautas al recopilar datos, realizar el análisis e interpretar los resultados.
- Las variables predictoras deben ser cuantitativas
- Debe tener una o más columnas numéricas que contengan los datos de medición de cada predictor. Minitab utiliza los datos para definir la relación entre el predictor y la respuesta. Si tiene un predictor categórico, no puede usar este análisis. En ese caso, utilice la regresión logística.
- Los predictores no deben estar muy correlacionados
- La correlación entre los predictores se denomina multicolinealidad. Si la multicolinealidad es severa, o si uno o más de los predictores son esencialmente constantes, Minitab no puede realizar el análisis discriminante y muestra un mensaje.
- La variable de respuesta debe indicar el grupo
- Usted debe tener una sola columna de agrupación que contenga los identificadores de hasta 20 grupos. Los identificadores de grupo pueden ser numéricos, de texto o de fecha/hora.
- Los datos de las variables predictoras deben ser normales para cada grupo
- La normalidad multivariada es un supuesto formal para el análisis discriminante. La función discriminante lineal es razonablemente robusta ante las desviaciones de la normalidad, pero la función discriminante cuadrática es más sensible al supuesto de normalidad. Considere la posibilidad de usar la regresión logística si los predictores no son normales. La regresión logística proporciona resultados más exactos en estos casos.
- Ingrese las probabilidades previas para el análisis, cuando sea posible
- A veces usted conoce la probabilidad de que una observación pertenezca a un grupo antes de realizar un análisis discriminante. Por ejemplo, si clasifica los compradores de un vehículo en particular, usted ya puede saber que el 60% de los compradores son hombres y el 40% son mujeres. Si conoce o puede calcular las probabilidades previas, especifíquelas para el análisis para obtener resultados más exactos.