Um banco exige oito informações de candidatos a empréstimos: renda, grau de instrução, idade, tempo na residência atual, tempo no emprego atual, poupança, dívidas e número de cartões de crédito. Um administrador bancário deseja analisar esses dados para determinar a melhor maneira de agrupá-los e relatá-los. O administrador coleta essas informações de 30 candidatos a empréstimos.
O administrador do banco usa a correlação de Pearson para examinar a força e a direção da relação linear entre cada par de variáveis.
Use também a matriz de dispersão para procurar outliers que possam influenciar fortemente os resultados. Por exemplo, a linha 6 contém um ponto de dados extremo que pode influenciar a correlação entre as variáveis. Um exemplo disso pode ser visto no gráfico dívida e idade.
Geralmente, quando a correlação é mais forte, o intervalo de confiança é mais estreito. Por exemplo, cartões de crédito e idade têm uma correlação fraca e o intervalo de confiança de 95% varia de -0,468 a 0,242.
Tipo de correlação | Pearson |
---|---|
Número de linhas usadas | 30 |
Idade | Residência | Emprego | Poupança | Dívida | |
---|---|---|---|---|---|
Residência | 0,838 | ||||
Emprego | 0,848 | 0,952 | |||
Poupança | 0,552 | 0,570 | 0,539 | ||
Dívida | 0,032 | 0,186 | 0,247 | -0,393 | |
Cartões de crédito | -0,130 | 0,053 | 0,023 | -0,410 | 0,474 |