Contribuições da coluna para Análise de correspondência múltipla

Coordenada principal da coluna

Os perfis de coluna residem em um espaço c-dimensional. O conjunto completo de eixos principais d abrangem esse espaço. Suponha que gj1, gj2, gj3, ..., gjd sejam as coordenadas do perfil da coluna j em termos dos eixos principais. Essas coordenadas são chamadas de coordenadas principais da coluna. A késima coordenada principal do perfil da coluna j é gjk.

O melhor subespaço k-dimensional é cruzado pelos primeiros eixos principais k. Se projetarmos o perfil da coluna j no melhor subespaço k-dimensional, gj1, ... gjk são as coordenadas principais da coluna do perfil neste subespaço.

Correlação

A correlação entre o perfil da coluna i e o principal componente k é calculado da seguinte maneira:

O Minitab calcula a inércia relativa de cada coluna. A inércia absoluta é o produto da inércia relativa e da inércia total.

A soma das correlações para coluna j, sobre todos os componentes principais é 1. A soma sobre as primeiras coordenadas principais k é a qualidade associada com o perfil da coluna j e o melhor subespaço k-dimensional.

Notação

TermoDescrição
gjk késima coordenada principal do perfil da coluna j

Inércia e inércia da célula

A inércia em uma célula está calculada da seguinte maneira:

A soma de todas as inércias da célula é a inércia total, algumas vezes simplesmente chamada de inércia, para a tabela.

A inércia relativa de uma célula é calculada da seguinte maneira:

Eixo principais (componentes principais)

Os perfis de coluna residem em um espaço c-dimensional. Subespaços dimensionais inferiores são cruzados por eixos principais, também chamados de componentes principais. O primeiro eixo principal é escolhido como o vetor no espaço c-dimensional que responde pela quantidade máxima da inércia total. Portanto, o primeiro eixo principal cruza o melhor (isto é, o mais próximo dos perfis que usa uma métrica adequada) subespaço unidimensional. O segundo eixo principal é escolhido como o vetor no espaço c-dimensional que responde pela quantidade máxima da inércia restante. Portanto, os dois primeiros eixos principais cruzam o melhor subespaço bidimensional. O terceiro eixo principal é escolhido como o vetor no espaço c-dimensional, após a inércia explicada pelos dois primeiros eixos principais. Portanto, os primeiros três eixos principais cruzam o melhor subespaço tridimensional e assim por diante.

Permita que d = o menor de (r − 1) e (c − 1). Os perfis da coluna realmente residem em um espaço d-dimensional do espaço c-dimensional completo (ou equivalentemente o espaço r-dimensional completo). Desta forma, o número de eixos principais é, no máximo, d.

Qualidade

A qualidade associada ao perfil da coluna j e o melhor subespaço k-dimensional são calculados da seguinte maneira:

A qualidade é sempre um número entre 0 e 1, com grandes números indicando uma melhor aproximação.

Notação

TermoDescrição
gjk késima coordenada principal do perfil da coluna j

Contribuição relativa à inércia total

A soma das inércias da célula em uma coluna é a contribuição da coluna à inércia total. A contribuição relativa de uma coluna à inércia total é calculada da seguinte maneira:

Contribuições da coluna

Cada coluna contribui para a inércia de cada eixo. A contribuição da coluna j para o eixo k, expresso como uma porcentagem da inércia do eixo k, é calculada da seguinte maneira:

A soma das contribuições para o eixo principal k, sobre todas as colunas j, é 1.

Notação

TermoDescrição
gjk késima coordenada principal do perfil da coluna j

Massa da coluna

A massa da coluna j é calculada da seguinte maneira:

O vetor das massas da coluna c é o mesmo que a média do perfil da coluna.

Coordenadas padronizadas

As coordenadas de colunas padronizadas do componente k são as principais coordenadas do componente k divididas pela raiz quadrada da késima inércia.