Interpretar todas as estatísticas e gráficos para Correlação

Encontre definições e orientações de interpretação para todas as estatísticas e gráficos fornecidos com a análise de correlação.

Correlações de Pearson

A matriz de correlação mostra os valores de correlação de Pearson, que medem o grau de relação linear entre cada par de variáveis. Os valores de correlação podem cair entre -1 e +1. Se as duas variáveis tendem a aumentar e diminuir juntas, o valor de correlação é positivo. Se uma variável aumenta enquanto a outra variável diminui, o valor de correlação é negativo.

Interpretação

Use a matriz de correlação para avaliar a força e a direção da relação entre duas variáveis. Um valor de correlação alto e positivo indica que as variáveis medem a mesma característica. Se os itens não estão altamente correlacionados, os itens podem medir diferentes características ou podem não estar claramente definidos.

Correlações

IdadeResidênciaEmpregoPoupançaDívida
Residência0,838       
Emprego0,8480,952     
Poupança0,5520,5700,539   
Dívida0,0320,1860,247-0,393 
Cartões de crédito-0,1300,0530,023-0,4100,474

Existe uma relação linear positiva entre Residência e Idade, Empregar e Idade, e Empregar e Residência. Os coeficientes de correlação de Pearson para esses pares são:
  • Residência e Idade, 0,838
  • Empregar e Idade, 0,848
  • Empregar e Residência, 0,952
Estes valores indicam que existe uma relação positiva moderada entre as variáveis.
Existe uma relação linear negativa para os seguintes pares, com coeficientes negativos de correlação de Pearson:
  • Dívida e Poupança , -0,393
  • Cartões de crédito e idade, -0,130
  • Cartões de crédito e poupança, -0,410
A relação entre essas variáveis é negativa, o que indica que, à medida que a dívida aumenta, a educação e a poupança diminuem, e à medida que o número de cartões de crédito aumenta, a economia também diminui.

Correlações de Spearman

Use o coeficiente de correlação de Spearman para analisar a intensidade e a direção da relação monótona entre duas variáveis contínuas ou ordinais. Em uma relação monotônica, as variáveis tendem a mover-se na mesma direção relativa, mas não necessariamente a uma taxa constante. Para calcular a correlação de Spearman, o Minitab atribui postos para os dados brutos. Em seguida, o Minitab calcula o coeficiente de correlação com os dados atribuídos em postos.

Resistência

O coeficiente de correlação pode variar em termos de valor de -1 a +1. Quanto maior for o valor absoluto do coeficiente, mais forte é a relação entre as variáveis.

Para a correlação de Spearman, um valor absoluto de 1 indica que os dados ordenados por posto são perfeitamente lineares. Por exemplo, uma correlação de Spearman de -1 significa que o maior valor para a variável A está associado ao menor valor para a variável B, o segundo maior valor para a variável A está associado com o segundo menor valor para a variável B, e assim por diante.

Direção

O sinal de cada coeficiente indica a direção da relação. Se ambas as variáveis tendem a aumentar ou diminuir em conjunto, o coeficiente é positivo, e a linha que representa a correlação inclina para cima. Se uma variável tende a aumentar à medida que os outras diminuem, o coeficiente é negativo, e a linha que representa a correlação inclina para baixo.

Os gráficos a seguir mostram os dados com valores de coeficiente de correlação de Spearman específicos para ilustrar padrões diferentes na força e direção das relações entre as variáveis.

Nenhum relacionamento: Rô de Spearman = 0

Os pontos caem aleatoriamente no gráfico, o que indica que não existe uma relação entre as variáveis.

Forte relação positiva: Rô de Spearman = 0,948

Os pontos caem perto da linha, o que indica que há uma forte relação entre as variáveis. A relação é positiva, porque as variáveis aumentam simultaneamente.

Forte relação negativa: Rô de Spearman = 1,0

Os pontos caem perto da linha, o que indica que há uma forte relação entre as variáveis. A relação é negativa, porque, conforme uma variável aumenta, a outra variável diminui.

Nunca é adequado concluir que as mudanças em uma variável causam mudanças em outra variável com base apenas na correlação. Somente experimentos adequadamente controlados permitem que você determine se uma relação é causal.

Interpretação

Correlação: Idade; Residência; Emprego; Poupança; Dívida; Cartões de crédito

Correlações

IdadeResidênciaEmpregoPoupançaDívida
Residência0,824       
Emprego0,8300,912     
Poupança0,5700,5710,496   
Dívida-0,198-0,142-0,056-0,605 
Cartões de crédito-0,1790,0690,036-0,4800,353

Correlações de Spearman pareadas

Amostra 1Amostra 2NCorrelaçãoIC de 95% para ρValor-p
ResidênciaIdade300,824(0,624; 0,922)0,000
EmpregoIdade300,830(0,636; 0,926)0,000
PoupançaIdade300,570(0,236; 0,783)0,001
DívidaIdade30-0,198(-0,524; 0,178)0,293
Cartões de créditoIdade30-0,179(-0,508; 0,197)0,345
EmpregoResidência300,912(0,798; 0,963)0,000
PoupançaResidência300,571(0,237; 0,784)0,001
DívidaResidência30-0,142(-0,479; 0,232)0,454
Cartões de créditoResidência300,069(-0,300; 0,419)0,719
PoupançaEmprego300,496(0,144; 0,737)0,005
DívidaEmprego30-0,056(-0,408; 0,311)0,768
Cartões de créditoEmprego300,036(-0,328; 0,392)0,849
DívidaPoupança30-0,605(-0,804; -0,283)0,000
Cartões de créditoPoupança30-0,480(-0,726; -0,124)0,007
Cartões de créditoDívida300,353(-0,020; 0,639)0,056

Nestes resultados, a correlação de Spearman entre Residência e Idade é de 0,824, o que indica que existe uma relação positiva entre as variáveis. O intervalo de confiança para rho é de 0,624 a 0,922. O valor-p é 0,000, o que indica que a relação é estatisticamente significativa ao nível α = 0,05.

A correlação de Spearman entre dívida e poupança é de -0,605 e entre cartões de crédito e poupança é de 0,480. A relação entre essas variáveis é negativa, o que indica que, como os cartões de débito e crédito aumentam, a economia diminui.

Linhas usadas

O número de linhas usadas é exibido na tabela método. É o número de linhas de dados, incluindo valores ausentes.

Quando você tem valores ausentes, o número de linhas usadas não é o mesmo que o tamanho real da amostra usado no cálculo do intervalo de confiança.

Intervalos de confiança para correlação

O intervalo de confiança fornece um intervalo de valores prováveis para os coeficientes de correlação. Como as amostras são aleatórias, é improvável que duas amostras de uma população produzam intervalos de confiança idênticos. Mas, se você repetir sua amostra várias vezes, uma determinada porcentagem dos intervalos de confiança ou limites resultantes conteria o coeficiente de correlação desconhecido. A porcentagem desses intervalos de confiança ou limites que contêm o coeficiente de correlação é o nível de confiança do intervalo.

Por exemplo, um nível de confiança de 95% indica que, se você extrair 100 amostras aleatórias da população, poderia esperar que, aproximadamente, 95 das amostras produza intervalos que contêm o coeficiente de correlação.

Uma fronteira superior define um valor provável que a diferença da população seja menor. Uma fronteira inferior define um valor provável que a diferença da população seja maior.

Os intervalos de confiança para a correlação de Pearson são sensíveis à normalidade da distribuição bivariada subjacente. Se os dados se desviarem da normalidade, os intervalos de confiança podem ser imprecisos, independentemente da magnitude do tamanho da amostra.

Os intervalos de confiança para as correlações de Spearman são baseados em classificações e são menos sensíveis à suposição de distribuição bivariada subjacente.

Interpretação

O intervalo de confiança ajuda a avaliar a significância prática de seus resultados. Use seu conhecimento especializado para determinar se o intervalo de confiança inclui valores que tenham significância prática para a sua situação. Se o intervalo for muito amplo para ser útil, pense em aumentar o tamanho da amostra. Para obter mais informações, vá para Como obter um intervalo de confiança mais preciso.

Correlação: Idade; Residência; Emprego; Poupança; Dívida; Cartões de crédito

Correlações de Pearson pareadas

Amostra 1Amostra 2NCorrelaçãoIC de 95% para ρValor-p
ResidênciaIdade300,838(0,684; 0,920)0,000
EmpregoIdade300,848(0,702; 0,926)0,000
PoupançaIdade300,552(0,240; 0,761)0,002
DívidaIdade300,032(-0,332; 0,388)0,865
Cartões de créditoIdade30-0,130(-0,468; 0,242)0,494
EmpregoResidência300,952(0,901; 0,977)0,000
PoupançaResidência300,570(0,264; 0,772)0,001
DívidaResidência300,186(-0,187; 0,512)0,326
Cartões de créditoResidência300,053(-0,313; 0,406)0,779
PoupançaEmprego300,539(0,222; 0,753)0,002
DívidaEmprego300,247(-0,125; 0,557)0,189
Cartões de créditoEmprego300,023(-0,340; 0,380)0,906
DívidaPoupança30-0,393(-0,660; -0,038)0,032
Cartões de créditoPoupança30-0,410(-0,671; -0,059)0,024
Cartões de créditoDívida300,474(0,138; 0,713)0,008

Nestes resultados, residência e idade têm uma correlação linear positiva de 0,838. Você pode ter 95% de confiança de que o coeficiente de correlação da população está entre 0,684 e 0,920. Geralmente, quando a correlação é mais forte, o intervalo de confiança é mais estreito. Por exemplo, cartões de crédito e idade têm uma correlação fraca e o intervalo de confiança de 95% varia de -0,468 a 0,242.

Valor-p

O valor-p é uma probabilidade que mede a evidência contra a hipótese nula. Um valor-p menor fornece uma evidência mais forte contra a hipótese nula.

Interpretação

Use o valor-p para determinar se o coeficiente de correlação é estatisticamente significativo.

Para determinar se o coeficiente de correlação é estatisticamente significativo, compare o valor-p com o nível de significância. Geralmente, um nível de significância (denotado como α ou alfa) de 0,05 funciona bem. Um nível de significância de 0,05 indica que o risco de se concluir que existe uma diferença, quando, na verdade, não existe nenhuma diferença real, é de 5%.
Valor-P ≤ α: A correlação é estatisticamente significativa (Rejeitar H0)
Se o valor-p for menor ou igual ao nível de significância, você deve rejeitar a hipótese nula. Você pode concluir que a correlação é estatisticamente significativa. Use seu conhecimento especializado para determinar se a diferença é praticamente significativa. Para obter mais informações, acesse Significância estatística e prática.
Valor-p > α: A correlação não é estatisticamente significativa (Falha ao rejeitar H0)
Se o valor-p for maior do que o nível de significância, você não deve rejeitar a hipótese nula. Você não tem evidências suficientes para concluir que a correlação é estatisticamente significativa.

Os procedimentos do valor-p para correlação de Pearson e correlação de Spearman são robustos para desvios da normalidade. Os valores-p são geralmente precisos para n ≥ 25, independentemente da população de pais da amostra.

Correlação: Idade; Residência; Emprego; Poupança; Dívida; Cartões de crédito

Correlações de Pearson pareadas

Amostra 1Amostra 2NCorrelaçãoIC de 95% para ρValor-p
ResidênciaIdade300,838(0,684; 0,920)0,000
EmpregoIdade300,848(0,702; 0,926)0,000
PoupançaIdade300,552(0,240; 0,761)0,002
DívidaIdade300,032(-0,332; 0,388)0,865
Cartões de créditoIdade30-0,130(-0,468; 0,242)0,494
EmpregoResidência300,952(0,901; 0,977)0,000
PoupançaResidência300,570(0,264; 0,772)0,001
DívidaResidência300,186(-0,187; 0,512)0,326
Cartões de créditoResidência300,053(-0,313; 0,406)0,779
PoupançaEmprego300,539(0,222; 0,753)0,002
DívidaEmprego300,247(-0,125; 0,557)0,189
Cartões de créditoEmprego300,023(-0,340; 0,380)0,906
DívidaPoupança30-0,393(-0,660; -0,038)0,032
Cartões de créditoPoupança30-0,410(-0,671; -0,059)0,024
Cartões de créditoDívida300,474(0,138; 0,713)0,008

Nestes resultados, existem muitos valores-p que são inferiores ao nível de significância de 0,05, o que indica que os coeficientes de correlação de Pearson são estatisticamente significativos.

Observação

Há casos em que, devido a pontos de dados extremos, o valor-p pode ser pequeno, mas o intervalo de confiança é muito grande. Por exemplo, com cartões de crédito e dívida, o IC 95% é muito amplo, mas o valor-p é pequeno. Quando você examina a matriz de dispersão, é possível ver um ponto de dados extremo.

Matriz de dispersão

A matriz de dispersão é uma matriz de gráficos de dispersão. Cada gráfico de dispersão na matriz representa graficamente os escores de um par de itens nos eixos x e y.

Interpretação

Use o gráfico para avaliar visualmente a relação entre cada combinação de variáveis. As relações podem ser lineares, monótonas ou nenhuma. Use também a matriz de dispersão para procurar outliers que possam influenciar fortemente os resultados. Para mais informações sobre os tipos de relacionamentos, acesse Relações lineares, não lineares e monotônicas.

Esta matriz de dispersão sugere que todos os pares dos itens têm uma relação linear positiva.