Interpretieren der wichtigsten Ergebnisse für Hauptkomponentenanalyse

Führen Sie die folgenden Schritte aus, um eine Hauptkomponentenanalyse zu interpretieren. Zu den wichtigsten Ergebnissen gehören die Eigenwerte, der von einer Komponente erklärte Anteil der Varianz, die Koeffizienten und verschiedene Grafiken.

Schritt 1: Bestimmen der Anzahl der Hauptkomponenten

Bestimmen Sie anhand der folgenden Methoden die Mindestanzahl an Hauptkomponenten, die den Großteil der Streuung in den Daten erklären.
Anteil an der Varianz, den die Komponenten erklären
Bestimmen Sie mit Hilfe des kumulativen Anteils den Umfang der Varianz, den die Hauptkomponenten erklären. Behalten Sie die Hauptkomponenten bei, die einen angemessenen Anteil der Varianz erklären. Welcher Anteil angemessen ist, hängt von Ihrer Anwendung ab. Zu Beschreibungszwecken müssen möglicherweise nur 80 % der Varianz erklärt werden. Wenn Sie mit den Daten jedoch weitere Analysen durchführen werden, möchten Sie vielleicht, dass die Hauptkomponenten mindestens 90 % der Varianz erklären.
Eigenwerte
Sie können die Anzahl der Hauptkomponenten anhand der Größe der Eigenwerte ermitteln. Behalten Sie die Hauptkomponenten mit den größten Eigenwerten bei. Wenn Sie z. B. das Kaiser-Kriterium heranziehen, verwenden Sie nur die Hauptkomponenten mit Eigenwerten größer als 1.
Screeplot
Die Eigenwerte werden im Screeplot vom höchsten zum niedrigsten Wert angeordnet. Das ideale Muster ist eine steile Kurve, die in eine Biegung und dann in eine Gerade übergeht. Verwenden Sie die Komponenten, die sich in der steilen Kurve vor dem ersten Punkt befinden, an dem der Trend zur Linie beginnt.

Eigenwertanalyse der Korrelationsmatrix

Eigenwert3,54762,13201,04470,53150,41120,16650,12540,0411
Anteil0,4430,2660,1310,0660,0510,0210,0160,005
Kumulativ0,4430,7100,8410,9070,9580,9790,9951,000

Eigenvektoren

VariablePC1PC2PC3PC4PC5PC6PC7PC8
Einkommen0,3140,145-0,676-0,347-0,2410,4940,018-0,030
Ausbildung0,2370,444-0,4010,2400,622-0,3570,1030,057
Alter0,484-0,135-0,004-0,212-0,175-0,487-0,657-0,052
Ansässig0,466-0,2770,0910,116-0,035-0,0850,487-0,662
Anstellung0,459-0,3040,122-0,017-0,014-0,0230,3680,739
Ersparnisse0,4040,2190,3660,4360,1430,568-0,348-0,017
Schulden-0,067-0,585-0,078-0,2810,6810,245-0,196-0,075
Kreditkarten-0,123-0,452-0,4680,703-0,195-0,022-0,1580,058
Wichtigste Ergebnisse: Kumulativ, Eigenwert, Screeplot

In diesen Ergebnissen weisen die ersten drei Hauptkomponenten Eigenwerte auf, die größer als 1 sind. Diese drei Komponenten erklären 84,1 % der Streuung in den Daten. Das Screeplot zeigt, dass die Eigenwerte nach der dritten Hauptkomponente beginnen, eine gerade Linie zu bilden. Wenn 84,1 % ein hinreichender Anteil der erklärten Streuung in den Daten ist, empfiehlt es sich, die ersten drei Hauptkomponenten zu verwenden.

Schritt 2: Interpretieren der einzelnen Komponenten in Hinblick auf die ursprünglichen Variablen

Um die einzelnen Hauptkomponenten zu interpretieren, untersuchen Sie Größe und Richtung der Koeffizienten für die ursprünglichen Variablen. Je größer der absolute Wert des Koeffizienten, desto wichtiger ist die entsprechende Variable bei der Berechnung der Komponente. Es hängt rein von der Betrachtung ab, wie groß der absolute Wert eines Koeffizienten sein muss, um als wichtig zu gelten. Nutzen Sie Ihr Fachwissen, um zu bestimmen, ab welcher Größe der Korrelationswert von Bedeutung ist.

Eigenwertanalyse der Korrelationsmatrix

Eigenwert3,54762,13201,04470,53150,41120,16650,12540,0411
Anteil0,4430,2660,1310,0660,0510,0210,0160,005
Kumulativ0,4430,7100,8410,9070,9580,9790,9951,000

Eigenvektoren

VariablePC1PC2PC3PC4PC5PC6PC7PC8
Einkommen0,3140,145-0,676-0,347-0,2410,4940,018-0,030
Ausbildung0,2370,444-0,4010,2400,622-0,3570,1030,057
Alter0,484-0,135-0,004-0,212-0,175-0,487-0,657-0,052
Ansässig0,466-0,2770,0910,116-0,035-0,0850,487-0,662
Anstellung0,459-0,3040,122-0,017-0,014-0,0230,3680,739
Ersparnisse0,4040,2190,3660,4360,1430,568-0,348-0,017
Schulden-0,067-0,585-0,078-0,2810,6810,245-0,196-0,075
Kreditkarten-0,123-0,452-0,4680,703-0,195-0,022-0,1580,058
Wichtigste Ergebnisse: Hauptkomponenten, Ladungsdiagramm

In diesen Ergebnissen weist die erste Hauptkomponente starke positive Assoziationen mit „Alter“, „Ansässig“, „Anstellung“ und „Ersparnisse“ auf, diese Komponente misst also in erster Linie die langfristige finanzielle Stabilität. Die zweite Komponente weist starke negative Assoziationen mit „Schulden“ und „Kreditkarten“ auf, diese Komponente misst also in erster Linie die Bonität eines Antragstellers. Die dritte Komponente weist starke negative Assoziationen mit „Einkommen“, „Ausbildung“ und „Kreditkarten“ auf, diese Komponente misst also in erster Linie die Situation eines Antragstellers hinsichtlich Bildung und Einkommen.

Das Ladungsdiagramm stellt die Ergebnisse für die ersten beiden Komponenten grafisch dar. „Alter“, „Ansässig“, „Anstellung“ und „Ersparnisse“ weisen große positive Ladungen für Komponente 1 auf, diese Komponente misst also die langfristige finanzielle Stabilität. „Schulden“ und „Kreditkarten“ weisen große negative Ladungen für Komponente 2 auf, diese Komponente misst also in erster Linie die Bonität eines Antragstellers.

Schritt 3: Identifizieren von Ausreißern

Verwenden Sie das Diagramm der Ausreißer, um Ausreißer zu identifizieren. Jeder Punkt, der oberhalb der Referenzlinie liegt, stellt einen Ausreißer dar. Ausreißer können die Ergebnisse Ihrer Analyse wesentlich beeinflussen. Wenn Sie einen Ausreißer in den Daten identifiziert haben, sollten Sie diese Beobachtung daher untersuchen, um die Ursache dafür zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Daten zu entfernen, die auf Ausnahmebedingungen zurückzuführen sind, und die Analyse zu wiederholen.

Wichtigstes Ergebnis: Diagramm der Ausreißer

In diesen Ergebnissen sind keine Ausreißer vorhanden. Alle Punkte liegen unterhalb der Referenzlinie.

Tipp

Zeigen Sie mit dem Mauszeiger auf einen beliebigen Punkt im Diagramm der Ausreißer, um die Beobachtung zu identifizieren. Verwenden Sie Editor > Markieren, um mehrere Ausreißer im Diagramm zu markieren und die Beobachtungen im Arbeitsblatt zu kennzeichnen.