Interpretar todas as estatísticas e gráficos para Análise de correspondência múltipla

Encontre definições e orientações de interpretação para cada estatística e gráfico fornecido com a análise de correspondência múltipla.

Eixo

O Minitab calcula cada eixo principal, que também é chamado de um componente principal. O Minitab ordena os componentes principais por quanto eles respondem pela inércia total. O primeiro componente principal (eixo) responde pela maior parte da inércia. O segundo componente principal (eixo) responde pela maior parte da inércia restante e assim por diante.

Interpretação

Use os eixos principais para avaliar quais componentes respondem pela maior parte da variabilidade nos dados.

Análise da Matriz de Indicadores

EixoInérciaProporçãoAcumuladoHistograma
10,40320,40320,4032******************************
20,25200,25200,6552******************
30,18990,18990,8451**************
40,15490,15491,0000***********
Total1,0000     

Esses resultados mostram a decomposição da inércia total em 4 componentes. A inércia total explicada pelos quatro componentes é 1.000. Da inércia total, o primeiro componente responde por 40,32% da inércia e o segundo componente responde por 25,20% da inércia. Juntos, esses 2 componentes respondem por 65,52% da inércia total. Portanto, especificar 2 componentes para a análise pode não ser suficiente. Adicionar um 3o. componente aumenta a proporção acumulada da inércia para 84,51%.

Inércia

A inércia de um componente descreve a quantidade da variação que o componente explica. A inércia de uma coluna descreve quanto os valores daquela categoria diferem do valor esperado sob a suposição de que nenhuma das cariáveis categóricas são correlacionadas. Para calcular a inércia de um componente, o Minitab multiplica a inércia de cada categoria pela correlação da categoria para aquele componente, e soma os produtos resultantes.

Interpretação

Use a inércia dos componentes para determinar quais componentes respondem pela maior parte da variabilidade nos dados.

Análise da Matriz de Indicadores

EixoInérciaProporçãoAcumuladoHistograma
10,40320,40320,4032******************************
20,25200,25200,6552******************
30,18990,18990,8451**************
40,15490,15491,0000***********
Total1,0000     

Esses resultados mostram a decomposição da inércia total em 4 componentes. A inércia total explicada pelos quatro componentes é 1.000. Da inércia total, o primeiro componente (eixo) responde por 40,32% da inércia e o segundo componente responde por 25,20% da inércia. Juntos, esses 2 componentes respondem por 65,52% da inércia total. Portanto, especificar 2 componentes para a análise pode não ser suficiente. Adicionar um 3o. componente aumenta a proporção acumulada da inércia para 84,51%.

Use a inércia das colunas para determinar quais categorias são as mais atípicas sob a suposição de que nenhuma das variáveis categóricas são correlacionadas. Para as inércias das colunas, as diferenças de (1/número de categorias) indicam as categorias mais atípicas.

Contribuições de Coluna






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Pequeno0,96550,04240,20760,38140,02970,0153-2,13940,93570,7707
2Padrão0,96550,20760,0424-0,07800,02970,00310,43740,93570,1576
3SemEjeção0,47390,21340,0366-0,28440,47170,0428-0,01970,00230,0003
4Ejeção0,47390,03660,21341,65870,47170,24970,11510,00230,0019
5Colis0,61330,19260,0574-0,42640,60950,08680,03380,00380,0009
6Capotagem0,61330,05740,19261,42940,60950,2911-0,11330,00380,0029
7NãoGrave0,56800,13530,1147-0,65230,50180,1428-0,23710,06630,0302
8Grave0,56800,11470,13530,76920,50180,16840,27950,06630,0356

Na tabela Contribuições da coluna, a coluna rotulada Inerte é a proporção da inércia total contribuída por cada categoria. Assim, a Ejeção desvia mais de seu valor esperado e contribui com 21,3% do total das estatísticas qui-quadrado.

Proporção, Acumulada e Histograma

A proporção indica a proporção da inércia total (a inércia explicada por todos os componentes) que cada componente principal (eixo) explica. O Minitab exibe os componentes na ordem de suas proporções, da maior para a menor. Cada proporção é visualmente representada no histograma.

A proporção acumulada indica a soma acumulada das proporções conforme os componentes (eixos) são adicionados.

Interpretação

Use a proporção e a proporção acumulada para ajudar a determinar quantos componentes são suficientes para explicar a maior parte da inércia total. Idealmente, dois ou três componentes respondem pela maior parte da inércia total e são mais importantes do que os outros componentes.

Análise da Matriz de Indicadores

EixoInérciaProporçãoAcumuladoHistograma
10,40320,40320,4032******************************
20,25200,25200,6552******************
30,18990,18990,8451**************
40,15490,15491,0000***********
Total1,0000     

Esses resultados mostram a decomposição da inércia total em 4 componentes. A inércia total explicada pelos quatro componentes é 1.000. Da inércia total, o primeiro componente (eixo) responde por 40,32% da inércia e o segundo componente responde por 25,20% da inércia. Juntos, esses 2 componentes respondem por 65,52% da inércia total. Portanto, especificar 2 componentes para a análise pode não ser suficiente. Adicionar um 3o. componente aumenta a proporção acumulada da inércia para 84,51%.

Qual

Qualidade (Qual) é a distância quadrática do ponto da origem no número escolhido de dimensões dividido pela distância quadrática da origem no espaço definido pelo número máximo de dimensões. O Minitab calcula um valor da qualidade para cada categoria.

Interpretação

Use os valores de qualidade para determinar a proporção de inércia representada pelos componentes de cada categoria. A qualidade é sempre um número entre 0 e 1. Valores maiores da qualidade indicam que a categoria é bem representada pelos componentes. Valores menores indicam representação inferior. Os valores da qualidade ajudam você a interpretar os componentes.

Use os valores de contribuição das colunas para avaliar quais categorias contribuem mais para a inércia de cada componente.

Contribuições de Coluna






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Pequeno0,96550,04240,20760,38140,02970,0153-2,13940,93570,7707
2Padrão0,96550,20760,0424-0,07800,02970,00310,43740,93570,1576
3SemEjeção0,47390,21340,0366-0,28440,47170,0428-0,01970,00230,0003
4Ejeção0,47390,03660,21341,65870,47170,24970,11510,00230,0019
5Colis0,61330,19260,0574-0,42640,60950,08680,03380,00380,0009
6Capotagem0,61330,05740,19261,42940,60950,2911-0,11330,00380,0029
7NãoGrave0,56800,13530,1147-0,65230,50180,1428-0,23710,06630,0302
8Grave0,56800,11470,13530,76920,50180,16840,27950,06630,0356

Nesta análise, o Minitab calcula dois principais componentes dos dados relacionados a acidentes de carro. Na tabela Contribuições da coluna, os valores da qualidade superiores ocorrem para tamanhos de carro pequeno (0,965) e Padrão (0,965). Portanto, essas duas categorias são melhores representadas pelos dois componentes. A ejeção do motorista tem a representação inferior, com um valor da qualidade de 0,474 para Ejeção e NãoEjeção. Capotagem (0,291) e Ejeção (0,250) contribuem o máximo para a inércia do Componente 1. Os tamanhos dos carros Pequenos (0,771) e Padrão (0,158) contribuem o máximo para a inércia do Componente 2. Contudo, esses resultados devem ser interpretados com cuidado, porque dois componentes podem não explicar adequadamente a variabilidade desses dados.

Massa

A massa é o total da matriz de frequências relativas de cada categoria. A massa de uma coluna é a soma de todas as frequências na coluna divididas pela soma de todas as frequências.

Interpretação

Use a massa para determinar a proporção de cada categoria de coluna. Valores maiores de massa indicam que a categoria da coluna tem uma frequência relativa maior. A massa total para todas as categorias da coluna é igual a 1 (100%).

Contribuições de Coluna






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Pequeno0,96550,04240,20760,38140,02970,0153-2,13940,93570,7707
2Padrão0,96550,20760,0424-0,07800,02970,00310,43740,93570,1576
3SemEjeção0,47390,21340,0366-0,28440,47170,0428-0,01970,00230,0003
4Ejeção0,47390,03660,21341,65870,47170,24970,11510,00230,0019
5Colis0,61330,19260,0574-0,42640,60950,08680,03380,00380,0009
6Capotagem0,61330,05740,19261,42940,60950,2911-0,11330,00380,0029
7NãoGrave0,56800,13530,1147-0,65230,50180,1428-0,23710,06630,0302
8Grave0,56800,11470,13530,76920,50180,16840,27950,06630,0356

A tabela Contribuições das colunas avalia as categorias de colunas relacionadas a acidentes de carro. A categoria NãoEjeção tem a maior massa (0,213) e responde por 21,3% dos dados. A categoria Ejeção tem a menor massa (0,037) e responde por 3,7% dos dados. Portanto, para esses dados, os acidentes que resultam em ejeção do motorista são relativamente raros, ao passo que acidentes que não resultam em ejeção do motorista são mais comuns.

Coord

O Minitab calcula as coordenadas (Coord) principais da coluna de cada componente. As coordenadas principais da coluna são coordenadas que são exibidas no gráfico de colunas.

Para exibir visualmente os pontos definidos pelas coordenadas principais da coluna, use o gráfico de colunas.

Corr

O valor da correlação da coluna representa a contribuição do componente à inércia da coluna. Os valores da correlação varia de 0 a 1.

Interpretação

Use o valor da correlação para interpretar cada componente em termos de sua contribuição à inércia da coluna. Os valores próximos a 1 indicam que o componente responde por uma alta quantidade de inércia. Valores próximos a 0 indicam que o componente contribui um pouco para a inércia.

Contribuições de Coluna






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Pequeno0,96550,04240,20760,38140,02970,0153-2,13940,93570,7707
2Padrão0,96550,20760,0424-0,07800,02970,00310,43740,93570,1576
3SemEjeção0,47390,21340,0366-0,28440,47170,0428-0,01970,00230,0003
4Ejeção0,47390,03660,21341,65870,47170,24970,11510,00230,0019
5Colis0,61330,19260,0574-0,42640,60950,08680,03380,00380,0009
6Capotagem0,61330,05740,19261,42940,60950,2911-0,11330,00380,0029
7NãoGrave0,56800,13530,1147-0,65230,50180,1428-0,23710,06630,0302
8Grave0,56800,11470,13530,76920,50180,16840,27950,06630,0356

A tabela Contribuições das colunas avalia as categorias de colunas relacionadas a acidentes de carro. O Componente 1 responde pela maior parte da inércia do tipo de acidente (Corr = 0,610 para Colis e Capotamento), mas explica um pouco da inércia do tamanho do carro (Corr = 0,030 para Pequeno e Padrão).

Contr

A contribuição (Contr) de cada categoria de coluna à inércia de cada componente.

Interpretação

Use os valores de contribuição de categorias de coluna para interpretar os componentes.

Contribuições de Coluna






Componente 1Componente 2
IDNomeQualMassaInerteCoordCorrContrCoordCorrContr
1Pequeno0,96550,04240,20760,38140,02970,0153-2,13940,93570,7707
2Padrão0,96550,20760,0424-0,07800,02970,00310,43740,93570,1576
3SemEjeção0,47390,21340,0366-0,28440,47170,0428-0,01970,00230,0003
4Ejeção0,47390,03660,21341,65870,47170,24970,11510,00230,0019
5Colis0,61330,19260,0574-0,42640,60950,08680,03380,00380,0009
6Capotagem0,61330,05740,19261,42940,60950,2911-0,11330,00380,0029
7NãoGrave0,56800,13530,1147-0,65230,50180,1428-0,23710,06630,0302
8Grave0,56800,11470,13530,76920,50180,16840,27950,06630,0356

A tabela Contribuições das colunas avalia as categorias de colunas relacionadas a acidentes de carro. Ejetar (Contr = 0250) e Capotar (Contr = 0,291) contribuem o máximo para a inércia do Componente 1. Os tamanhos dos carros de Pequeno (Contr = 0,771) e Padrão (Contr = 0,158) contribuem o máximo para a inércia do Componente 2.

Gráfico de colunas

O gráfico de colunas mostra as coordenadas principais das categorias de coluna. O Minitab representa graficamente pontos de coluna com quadrados azuis, quadrados sólidos para pontos regulares e abre quadrados para pontos suplementares.
Observação

Por padrão, o Minitab exibe os pontos para os primeiros dois componentes principais, que respondem pela maior quantidade de inércia total. Para exibir outros componentes principais (eixos) no gráfico, clique em Gráficos e insira os números de componentes quando você realizar a análise.

Interpretação

Use o gráfico de colunas para procurar relações entre categorias de coluna e para ajudar a interpretar os principais componentes em relação às categorias de coluna. Os pontos que estão mais distantes da origem indicam categorias que são mais influentes. Os pontos nos lados opostos do gráfico indicam que um componente contrasta estas categorias.

Neste gráfico de colunas, Ejetar e Rolar estão bem distantes da origem ao longo do eixo horizontal para o componente 1. Isso corresponde à contribuição relativamente alta (Contr) para essas categorias para o componente 1. Como Ejetar e Não ejetar, e também Grave e Não grave, estão em lados opostos da origem, o componente 1 contrasta esses valores de categoria. O componente 2 é mostrado no eixo vertical. O carro pequeno localizado longe das outras categorias em um lado do eixo vertical. Portanto, o componente 2 contrasta o carro pequeno com outras categorias.

Tabela indicadora

A tabela indicadora exibe todas as observações em seus dados na forma de variáveis indicadoras. Cada variável indicadora (coluna) representa um nível da variável categórica e cada observação (linha) leva um valor binário dependendo se ele pertence (1) ou não (0) à categoria. Portanto, os valores em todas as colunas devem ser 0 ou 1.

Para incluir a tabela indicadora em seus resultados, você deve clicar em Resultados e selecionar a opção para exibir a tabela quando você realizar a análise.

Nesta tabela indicadora, a primeira observação na linha 1 indica um homem de tamanho normal que fuma e pratica atividade física regular. A segunda observação na linha 2 indica uma mulher que tem sobrepeso, não fuma e pratica atividade física regular.
C1 C2 C3 C4 C5 C6 C7 C8 C8
Masculino Feminino Peso normal Abaixo do peso Acima do peso Fuma Não fumante Atividade Nenhuma atividade
1 0 1 0 0 1 0 1 0
0 1 0 0 1 0 1 1 0
0 1 1 0 0 0 1 0 1
1 0 1 0 0 0 1 1 0
0 1 0 1 0 0 1 0 1
0 1 0 0 1 1 0 0 1

Tabela de Burt

Uma tabela de Burt é uma matriz simétrica usada para ajudar a visualizar e analisar relações entre variáveis categóricas. Para incluir a tabela indicadora em seus resultados, você deve clicar em Resultados e selecionar a opção para exibir a tabela quando você realizar a análise.

A tabela de Burt possui uma coluna e uma linha para cada nível (categoria) de cada variável categórica. Por exemplo, se os dados são divididos entre 3 variáveis categóricas como Sexo (masculino, feminino), Nível de atividade (leve, médio, alto) e Idade (<20, 20-50, >50), a tabela de Burt possui 2 + 3 + 3 = 8 linhas e 8 colunas.
  Masculino Feminino Leve Médio Alto <20 20-50 >50
Homem 87 0 33 45 9 26 47 14
Mulher 0 163 27 111 25 43 89 31
Leve 33 27 60 0 0 14 48 7
Médio 45 111 0 111 0 14 107 18
Alto 9 25 0 0 79 9 30 3
<20 26 43 14 14 9 37 0 0
20-50 47 89 48 107 30 0 185 0
>50 14 31 7 18 3 0 0 28

Cada entrada na tabela de Burt mostra o número de observações que satisfazem as categorias na linha e na coluna correspondentes. Por exemplo, a entrada na linha 1 e na coluna 3 é o número de observações que são ambas homem e levemente ativos (33). A entrada na linha 1 e na coluna 2 é o número de observações que são ambas homem e mulher (0).

Você pode determinar o número total de observações de cada categoria nas entradas diagonais do canto superior esquerdo ao inferior direito, onde cada entrada tem o mesmo cabeçalho de coluna e de linha. Por exemplo, a entrada na linha 1 e na coluna 1 mostra o número total de Homens (87), a entrada na linha 2 e na coluna 2 mostra o número total de Mulheres (163) e assim por diante.