Beispiel für Korrelation

Eine Bank benötigt acht Angaben von Kreditantragstellern: Einkommen, Bildungsniveau, Alter, Ansässigkeitsdauer am gegenwärtigen Wohnsitz, Anstellungsdauer beim gegenwärtigen Arbeitgeber, Ersparnisse, Schulden und Anzahl der Kreditkarten. Ein Bankangestellter möchte diese Daten analysieren, um die beste Möglichkeit zu ermitteln, sie zu gruppieren und in Berichten darzustellen. Der Angestellte erfasst diese Angaben für 30 Kreditantragsteller.

Der Bankangestellte untersucht anhand der Korrelationen nach Pearson die Stärke und Richtung der linearen Beziehungen zwischen den einzelnen Variablenpaaren.

  1. Öffnen Sie die Beispieldaten Kreditanträge.MTW.
  2. Wählen Sie Statistik > Statistische Standardverfahren > Korrelation aus.
  3. Geben Sie im Feld Variablen die Spalten Alter Ansässig Anstellung Ersparnisse Schulden 'Kreditkarten' ein.
  4. Klicken Sie auf Grafiken.
  5. Wählen Sie in Auf Plot darzustellende Statistiken die Option Korrelationen und Intervalle aus.
  6. Klicken Sie in den einzelnen Dialogfeldern auf OK.

Interpretieren der Ergebnisse

Verwenden Sie das Matrixplot, um die Beziehung zwischen den einzelnen Kombinationen von Variablen visuell auszuwerten. Die Beziehungen können linear, monoton oder weder linear noch monoton sein.
  • Der höchste Korrelationskoeffizient nach Pearson liegt zwischen Beschäftigung und Wohnort vor. Der Wert 0,952 stellt eine positive Beziehung zwischen den Variablen dar. Mit zunehmendem Wert für Beschäftigung nimmt auch der Wert für Wohnort zu. Das 95%-Konfidenzintervall erstreckt sich von 0,901 bis 0,977.
  • Der Korrelationskoeffizient nach Pearson zwischen Kreditkarten und Ersparnisse beträgt –0,410. Mit zunehmender Anzahl von Kreditkarten nehmen die Ersparnisse tendenziell ab. Das 95%-Konfidenzintervall reicht von –0,671 bis –0,059.

Sie können das Matrixplot auch verwenden, um nach Ausreißern zu suchen, die die Ergebnisse erheblich beeinflussen können. Zeile 6 enthält beispielsweise einen extremen Datenpunkt, der die Korrelation zwischen Variablen beeinflussen kann. Ein Beispiel hierfür ist im Diagramm für Schulden und Alter ersichtlich.

Im Allgemeinen ist das Konfidenzintervall bei einer stärkeren Korrelation schmaler. Zwischen Kreditkarten und Alter besteht beispielsweise eine schwache Korrelation, und das 95%-Konfidenzintervall erstreckt sich von -0,468 bis 0,242.

Korrelation: Alter; Ansässig; Anstellung; Ersparnisse; Schulden; Kreditkarten

Methode

KorrelationstypPearson
Anzahl der verwendeten Zeilen30

Korrelationen

AlterAnsässigAnstellungErsparnisseSchulden
Ansässig0,838       
Anstellung0,8480,952     
Ersparnisse0,5520,5700,539   
Schulden0,0320,1860,247-0,393 
Kreditkarten-0,1300,0530,023-0,4100,474