Distância e funções discriminantes para Análise discriminante

Distância quadrada

Distância quadrada de Mahalanobis - Forma geral

A distância quadrada (também chamada de distância de Mahalanobis) da observação x ao centro (média) do grupo t para discriminante linear é dada pela seguinte forma geral:

Distância quadrada de Mahalanobis - Função quadrática

A distância quadrada de Mahalanobis de x para o grupo t para a função discriminante quadrática é calculada da seguinte forma:

Distância quadrada generalizada - Função linear

A distância quadrada generalizada de x para o grupo t para a função discriminante linear é calculada da seguinte forma:

Distância quadrada generalizada - Função quadrática

A distância quadrada generalizada de x para o grupo t para a função discriminante quadrática é calculada da seguinte forma:

Probabilidade posterior

A probabilidade posterior para x pertencente ao grupo t é calculada da seguinte maneira:

Escores discriminantes lineares

Os escores discriminantes lineares são calculados da seguinte maneira:

Notação

TermoDescrição
xvetor da coluna de comprimento p contendo os valores das preditoras desta observação (esse vetor da coluna está armazenado como uma linha)
pnúmero de preditoras
nnúmero total de observações
tidentificações do grupo
ntnúmero de observações no grupo t
qta probabilidade anterior do grupo t, que iguala nt/r
Spa matriz de covariância combinada para análise discriminante linear
Si matriz de covariância do grupo i para análise discriminante quadrática
mtvetor da coluna de comprimento p contendo as médias das preditoras calculadas a partir dos dados no grupo t
Stmatriz de covariância do grupo t
|St|determinante de St

Função discriminante linear

A função discriminante linear corresponde aos coeficientes de regressão na regressão múltipla e é calculado da seguinte forma:

Para um dada x, esta regra aloca x ao grupo com a maior função discriminante linear.

Notação

TermoDescrição
xvetor da coluna de comprimento p contendo os valores das preditoras desta observação (esse vetor da coluna está armazenado como uma linha)
mivetor da coluna de comprimento p contendo as médias das preditoras calculadas a partir dos dados no grupo i
Spmatriz de covariância combinada
ln pilog natural da probabilidade anterior para o grupo i

Distância quadrada generalizada

A distância quadrada generalizada é usada como a medida da distância quadrática e é calculada da seguinte forma:

Notação

TermoDescrição
xvetor da coluna de comprimento p contendo os valores das preditoras desta observação (esse vetor da coluna está armazenado como uma linha)
mivetor da coluna de comprimento p contendo as médias das preditoras calculadas a partir dos dados no grupo i
Spmatriz de covariância combinada f
ln pilog natural da probabilidade anterior para o grupo i

Probabilidade posterior

A probabilidade posterior é a probabilidade do grupo i considerando-se os dados, e é calculada da seguinte maneira:

A maior probabilidade posterior é equivalente ao maior valor de ln [pi fi (x)]

onde (se distribuição é normal):
e

Notação

TermoDescrição
piprobabilidade anterior para o grupo i
fi(x)a densidade conjunta para os dados no grupo i (com os parâmetros da população substituídos pelas estimativas da amostra)