Considerações de dados para Análise discriminante

Para garantir que seus resultados sejam válidos, considere as seguintes diretrizes ao coletar dados, realizar a análise, e interpretar os resultados.

As variáveis preditoras devem ser quantitativas
Você deve ter uma ou mais colunas numéricas contendo dados de medição para cada preditora. O Minitab usa os dados para definir a relação entre a preditora e a resposta. Se você tiver uma preditora categórica, não pode usar esta análise. Em vez disso, use a regressão logística.
As preditoras não devem estar altamente correlacionadas
A correlação entre as preditoras é chamada de multicolinearidade. Se a multicolinearidade for grave ou se uma ou mais das preditoras for essencialmente constante, o Minitab não pode realizar a análise discriminante e exibe uma mensagem.
A variável de resposta deve indicar o grupo
Você deve ter uma coluna de agrupamento única que contém identificadores para até 20 grupos. Os identificadores de grupo podem ser numéricos, de texto ou de data/hora.
Os dados das variáveis preditoras devem ser normais para cada grupo
A normalidade multivariada é uma suposição formal para análise discriminante. A função discriminante linear é razoavelmente robusta para desvios da normalidade, mas a função discriminante quadrática é mais sensível à suposição da normalidade. Considere usar a regressão logística se suas preditoras não forem normais. A regressão logística fornece resultados mais exatos nesses casos.
Insira probabilidades anteriores para a análise, quando possível
Algumas vezes você sabe a probabilidade de uma observação pertencente a um grupo antes de realizar uma análise discriminante. Por exemplo, se você está classificando os compradores de um carro específico, poderia saber de antemão que 60% dos compradores são homens e 40% são mulheres. Se você souber ou puder estimar probabilidades anteriores, especifique-as para a análise para aumentar a exatidão dos seus resultados.