Distância e funções discriminantes para Análise discriminante

Neste tópico

Distância quadrada
Função discriminante linear
Distância quadrada generalizada
Probabilidade posterior

Distância quadrada

Distância quadrada de Mahalanobis - Forma geral

A distância quadrada (também chamada de distância de Mahalanobis) da observação x ao centro (média) do grupo t para discriminante linear é dada pela seguinte forma geral:

Distância quadrada de Mahalanobis - Função quadrática

A distância quadrada de Mahalanobis de x para o grupo t para a função discriminante quadrática é calculada da seguinte forma:

Distância quadrada generalizada - Função linear

A distância quadrada generalizada de x para o grupo t para a função discriminante linear é calculada da seguinte forma:

Distância quadrada generalizada - Função quadrática

A distância quadrada generalizada de x para o grupo t para a função discriminante quadrática é calculada da seguinte forma:

Probabilidade posterior

A probabilidade posterior para x pertencente ao grupo t é calculada da seguinte maneira:

Escores discriminantes lineares

Os escores discriminantes lineares são calculados da seguinte maneira:

Notação

Termo	Descrição
x	vetor da coluna de comprimento p contendo os valores das preditoras desta observação (esse vetor da coluna está armazenado como uma linha)
p	número de preditoras
n	número total de observações
t	identificações do grupo
n_t	número de observações no grupo t
q_t	a probabilidade anterior do grupo t, que iguala n_t/r
S_p	a matriz de covariância combinada para análise discriminante linear
S_i	matriz de covariância do grupo i para análise discriminante quadrática
m_t	vetor da coluna de comprimento p contendo as médias das preditoras calculadas a partir dos dados no grupo t
S_t	matriz de covariância do grupo t
\|S_t\|	determinante de S_t

Função discriminante linear

A função discriminante linear corresponde aos coeficientes de regressão na regressão múltipla e é calculado da seguinte forma:

Para um dada x, esta regra aloca x ao grupo com a maior função discriminante linear.

Notação

Termo	Descrição
x	vetor da coluna de comprimento p contendo os valores das preditoras desta observação (esse vetor da coluna está armazenado como uma linha)
m_i	vetor da coluna de comprimento p contendo as médias das preditoras calculadas a partir dos dados no grupo i
S_p	matriz de covariância combinada
ln p_i	log natural da probabilidade anterior para o grupo i

Distância quadrada generalizada

A distância quadrada generalizada é usada como a medida da distância quadrática e é calculada da seguinte forma:

Notação

Termo	Descrição
x	vetor da coluna de comprimento p contendo os valores das preditoras desta observação (esse vetor da coluna está armazenado como uma linha)
m_i	vetor da coluna de comprimento p contendo as médias das preditoras calculadas a partir dos dados no grupo i
S_p	matriz de covariância combinada f
ln p_i	log natural da probabilidade anterior para o grupo i

Probabilidade posterior

A probabilidade posterior é a probabilidade do grupo i considerando-se os dados, e é calculada da seguinte maneira:

A maior probabilidade posterior é equivalente ao maior valor de ln [p_i f_i(x)]

onde (se distribuição é normal):

Notação

Termo	Descrição
p_i	probabilidade anterior para o grupo i
f_i(x)	a densidade conjunta para os dados no grupo i (com os parâmetros da população substituídos pelas estimativas da amostra)