Interpretar os principais resultados para Análise de componentes principais

Conclua as etapas a seguir para interpretar uma análise fatorial. A saída principal inclui os autovalores, a proporção da variância que o componente explica, os coeficientes e diversos gráficos.

Etapa 1: Determinar o número de componentes principais

Determine o número mínimo de componentes principais que respondem pela maior parte da variação em seus dados, usando os seguintes métodos.
Proporção de variância que os componentes explicam
Use a proporção acumulada para determinar a quantidade de variância que os componentes principais explicam. Retenha os componentes principais que explicam um nível aceitável de variância. O nível aceitável depende da sua aplicação. Para fins descritivos, você pode necessitar de apenas 80% da variância explicada. Contudo, se quiser realizar outras análises nos dados, você deve ter, no mínimo, 90% da variância explicada pelos componentes principais.
Autovalores
Você pode usar o tamanho do autovalor para determinar o número de componentes principais. Retenha os componentes principais com os maiores autovalores. Por exemplo, usando o critério Kaiser, você usa somente os componentes principais com os autovalores que são maiores que 1.
Gráfico scree
O gráfico scree ordena os autovalores do maior para o menor. O padrão ideal é uma curva acentuada, seguida de uma dobra e depois de uma linha reta. Use os componentes na curva acentuada antes do primeiro ponto que inicia a tendência da linha.

Autoanálise (Autovalores e Autovetores) da Matriz de Correlação

Autovalor3,54762,13201,04470,53150,41120,16650,12540,0411
Proporção0,4430,2660,1310,0660,0510,0210,0160,005
Acumulado0,4430,7100,8410,9070,9580,9790,9951,000

Autovetores

VariávelCP1CP2CP3CP4CP5CP6CP7CP8
Renda0,3140,145-0,676-0,347-0,2410,4940,018-0,030
Grau de instrução0,2370,444-0,4010,2400,622-0,3570,1030,057
Idade0,484-0,135-0,004-0,212-0,175-0,487-0,657-0,052
Residência0,466-0,2770,0910,116-0,035-0,0850,487-0,662
Emprego0,459-0,3040,122-0,017-0,014-0,0230,3680,739
Poupança0,4040,2190,3660,4360,1430,568-0,348-0,017
Dívida-0,067-0,585-0,078-0,2810,6810,245-0,196-0,075
Cartões de crédito-0,123-0,452-0,4680,703-0,195-0,022-0,1580,058
Principais resultados: acumulado, autovalor, gráfico scree

Nesses resultados, os primeiros três componentes principais têm autovalores maiores do que 1. Esses três componentes explicam 84,1% da variação nos dados. O gráfico scree mostra que os autovalores começam a formar uma linha reta após o terceiro componente principal. Se 84,1% é uma quantidade adequada de variação explicada nos dados, você deve usar os primeiros três componentes principais.

Etapa 2: Interpretar cada componente principal em termos das variáveis originais

Para interpretar cada componente principal, examine a magnitude e a direção dos coeficientes das variáveis originais. Quanto maior o valor absoluto do coeficiente, mais importante será a variável correspondente ao calcular o componente. Quão grande o valor absoluto de um coeficiente precisa ser a fim de que sua importância seja considerada subjetiva. Use seu conhecimento especializado para determinar em que nível o valor da correlação é importante.

Autoanálise (Autovalores e Autovetores) da Matriz de Correlação

Autovalor3,54762,13201,04470,53150,41120,16650,12540,0411
Proporção0,4430,2660,1310,0660,0510,0210,0160,005
Acumulado0,4430,7100,8410,9070,9580,9790,9951,000

Autovetores

VariávelCP1CP2CP3CP4CP5CP6CP7CP8
Renda0,3140,145-0,676-0,347-0,2410,4940,018-0,030
Grau de instrução0,2370,444-0,4010,2400,622-0,3570,1030,057
Idade0,484-0,135-0,004-0,212-0,175-0,487-0,657-0,052
Residência0,466-0,2770,0910,116-0,035-0,0850,487-0,662
Emprego0,459-0,3040,122-0,017-0,014-0,0230,3680,739
Poupança0,4040,2190,3660,4360,1430,568-0,348-0,017
Dívida-0,067-0,585-0,078-0,2810,6810,245-0,196-0,075
Cartões de crédito-0,123-0,452-0,4680,703-0,195-0,022-0,1580,058
Principais resultados: PC, gráfico de cargas fatoriais

Nesses resultados, o primeiro componente principal tem grandes associações positivas com Idade, Residência, Emprego e Economias, portanto este componentes mede, principalmente, a estabilidade financeira de longo prazo. O segundo componente tem grandes associações negativas com Cartões de débito e de crédito, portanto, este componente mede principalmente o histórico de crédito de um candidato. O terceiro componente tem grandes associações negativas com renda, educação e cartões de crédito, de forma que este componente mede principalmente as qualificações acadêmicas e de renda do candidato.

O gráfico de cargas fatoriais mostra visualmente os resultados dos primeiros dois componentes. Idade, Residência, Emprego e Economias têm grandes cargas fatoriais positivas no componente 1, portanto, este componente mede a estabilidade financeira de longo prazo. Dívidas e Cartões de Crédito têm grandes cargas fatoriais negativas no componente 2, portanto, este componente mede principalmente o histórico de crédito de um candidato.

Etapa 3: Identificar outliers

Use o gráfico de outliers para identificar outliers. Qualquer ponto que está acima da linha de referência é um outlier. Outliers podem afetar significativamente os resultados de sua análise. Portanto, se você identificar um outlier em seus dados, deverá examinar a observação para entender por que ele é atípico. Corrija quaisquer medições ou erros de entrada de dados. Considere remover os dados que estão associados a causas especiais e repetir a análise.

Principal resultado: gráfico de outliers

Nesses resultados, não há outliers. Todos os pontos estão abaixo da linha de referência.

Dica

Mantenha o ponteiro sobre qualquer ponto em um gráfico de outliers para identificar a observação. Use Editor > Função Brush para aplicar a Função Brush em múltiplos outliers no gráfico e a de função de sinalizador nas observações na worksheet.