Funciones de distancia y discriminante para Análisis discriminante

Distancia al cuadrado

Distancia al cuadrado de Mahalanobis - Forma general

La distancia al cuadrado (también denominada distancia de Mahalanobis) desde la observación x hasta el centro (media) del grupo t para la función discriminante lineal viene dada por la siguiente forma general:

Distancia al cuadrado de Mahalanobis - Función cuadrática

La distancia al cuadrado de Mahalanobis desde x hasta el grupo t para la función discriminante cuadrática se calcula de la siguiente manera:

Distancia al cuadrado generalizada - Función lineal

La distancia al cuadrado generalizada desde x hasta el grupo t para la función discriminante lineal se calcula de la siguiente manera:

Distancia al cuadrado generalizada - Función cuadrática

La distancia al cuadrado generalizada desde x hasta el grupo t para la función discriminante cuadrática se calcula de la siguiente manera:

Probabilidad posterior

La probabilidad posterior de que x pertenezca al grupo t se calcula de la siguiente manera:

Puntuaciones discriminantes lineales

Las puntuaciones discriminantes lineales se calculan de la siguiente manera:

Notación

TérminoDescription
xvector de columnas de longitud p que contiene los valores de los predictores para esta observación (este vector de columnas se almacena como una fila)
pnúmero de predictores
nnúmero total de observaciones
tsubíndice de grupo
ntnúmero de observaciones en el grupo t
qtla probabilidad previa del grupo t, que es igual a nt/n
Spmatriz de covarianza agrupada para el análisis discriminante lineal
Si matriz de covarianza del grupo i para el análisis discriminante cuadrático
mtvector de columnas de longitud p que contiene las medias de los predictores calculadas a partir de los datos en el grupo t
Stmatriz de covarianza del grupo t
|St|determinante de St

Función discriminante lineal

La función discriminante lineal corresponde a los coeficientes de regresión en la regresión múltiple y se calcula de la siguiente manera:

Para una x dada, esta regla asigna x al grupo con la mayor función discriminante lineal.

Notación

TérminoDescription
xvector de columnas de longitud p que contiene los valores de los predictores para esta observación (este vector de columnas se almacena como una fila)
mivector de columnas de longitud p que contiene las medias de los predictores calculadas a partir de los datos en el grupo i
Spmatriz de covarianza agrupada
ln pilogaritmo natural de la probabilidad previa del grupo i

Distancia al cuadrado generalizada

La distancia al cuadrado generalizada se utiliza como la medida de distancia cuadrática y se calcula de la siguiente manera:

Notación

TérminoDescription
xvector de columnas de longitud p que contiene los valores de los predictores para esta observación (este vector de columnas se almacena como una fila)
mivector de columnas de longitud p que contiene las medias de los predictores calculadas a partir de los datos en el grupo i
Spmatriz de covarianza agrupada f
ln pilogaritmo natural de la probabilidad previa del grupo i

Probabilidad posterior

La probabilidad posterior es la probabilidad del grupo i dados los datos y se calcula de la siguiente manera:

La probabilidad posterior más grande es equivalente al valor más grande de ln [pi fi (x)]

donde (si la distribución es normal):
y

Notación

TérminoDescription
piprobabilidad previa del grupo i
fi(x)la densidad conjunta para los datos en el grupo i (con los parámetros de población sustituidos por las estimaciones de la muestra)