Interpretieren der wichtigsten Ergebnisse für Hauptkomponentenanalyse

Führen Sie die folgenden Schritte aus, um eine Hauptkomponentenanalyse zu interpretieren. Zu den wichtigsten Ergebnissen gehören die Eigenwerte, der von einer Komponente erklärte Anteil der Varianz, die Koeffizienten und verschiedene Grafiken.

Schritt 1: Bestimmen der Anzahl der Hauptkomponenten

Bestimmen Sie anhand der folgenden Methoden die Mindestanzahl an Hauptkomponenten, die den Großteil der Streuung in den Daten erklären.
Anteil an der Varianz, den die Komponenten erklären
Bestimmen Sie mit Hilfe des kumulativen Anteils den Umfang der Varianz, den die Hauptkomponenten erklären. Behalten Sie die Hauptkomponenten bei, die einen angemessenen Anteil der Varianz erklären. Welcher Anteil angemessen ist, hängt von Ihrer Anwendung ab. Zu Beschreibungszwecken müssen möglicherweise nur 80 % der Varianz erklärt werden. Wenn Sie mit den Daten jedoch weitere Analysen durchführen werden, möchten Sie vielleicht, dass die Hauptkomponenten mindestens 90 % der Varianz erklären.
Eigenwerte
Sie können die Anzahl der Hauptkomponenten anhand der Größe der Eigenwerte ermitteln. Behalten Sie die Hauptkomponenten mit den größten Eigenwerten bei. Wenn Sie z. B. das Kaiser-Kriterium heranziehen, verwenden Sie nur die Hauptkomponenten mit Eigenwerten größer als 1.
Screeplot
Im Screeplot werden die Eigenwerte vom größten zum kleinsten sortiert. Das ideale Muster ist eine steile Kurve, die in eine Biegung und dann in eine Gerade übergeht. Verwenden Sie die Komponenten, die sich in der steilen Kurve vor dem ersten Punkt befinden, an dem der Trend zur Linie beginnt.

Hauptkomponentenanalyse: Einkommen; Ausbildung; Alter; Ansässig; ...

Eigenwertanalyse der Korrelationsmatrix Eigenwert 3,5476 2,1320 1,0447 0,5315 0,4112 0,1665 0,1254 0,0411 Anteil 0,443 0,266 0,131 0,066 0,051 0,021 0,016 0,005 Kumulativ 0,443 0,710 0,841 0,907 0,958 0,979 0,995 1,000
Eigenvektoren Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 Einkommen 0,314 0,145 -0,676 -0,347 -0,241 0,494 0,018 -0,030 Ausbildung 0,237 0,444 -0,401 0,240 0,622 -0,357 0,103 0,057 Alter 0,484 -0,135 -0,004 -0,212 -0,175 -0,487 -0,657 -0,052 Ansässig 0,466 -0,277 0,091 0,116 -0,035 -0,085 0,487 -0,662 Anstellung 0,459 -0,304 0,122 -0,017 -0,014 -0,023 0,368 0,739 Ersparnisse 0,404 0,219 0,366 0,436 0,143 0,568 -0,348 -0,017 Schulden -0,067 -0,585 -0,078 -0,281 0,681 0,245 -0,196 -0,075 Kreditkarten -0,123 -0,452 -0,468 0,703 -0,195 -0,022 -0,158 0,058
Wichtigste Ergebnisse: Kumulativ, Eigenwert, Screeplot

In diesen Ergebnissen weisen die ersten drei Hauptkomponenten Eigenwerte größer als 1 auf. Diese drei Komponenten erklären 84,1 % der Streuung in den Daten. Das Screeplot zeigt, dass die Eigenwerte nach der dritten Hauptkomponente beginnen, eine gerade Linie zu bilden. Wenn es ausreicht, das 84,1 % der Streuung in den Daten erklärt wird, sollten Sie die ersten drei Hauptkomponenten verwenden.

Schritt 2: Interpretieren der einzelnen Komponenten in Hinblick auf die ursprünglichen Variablen

Um die einzelnen Hauptkomponenten zu interpretieren, untersuchen Sie Größe und Richtung der Koeffizienten für die ursprünglichen Variablen. Je größer der absolute Wert des Koeffizienten, desto wichtiger ist die entsprechende Variable bei der Berechnung der Komponente. Es hängt rein von der Betrachtung ab, wie groß der absolute Wert eines Koeffizienten sein muss, um als wichtig zu gelten. Nutzen Sie Ihr Fachwissen, um zu bestimmen, ab welcher Größe der Korrelationswert von Bedeutung ist.

Hauptkomponentenanalyse: Einkommen; Ausbildung; Alter; Ansässig; ...

Eigenwertanalyse der Korrelationsmatrix Eigenwert 3,5476 2,1320 1,0447 0,5315 0,4112 0,1665 0,1254 0,0411 Anteil 0,443 0,266 0,131 0,066 0,051 0,021 0,016 0,005 Kumulativ 0,443 0,710 0,841 0,907 0,958 0,979 0,995 1,000
Eigenvektoren Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 Einkommen 0,314 0,145 -0,676 -0,347 -0,241 0,494 0,018 -0,030 Ausbildung 0,237 0,444 -0,401 0,240 0,622 -0,357 0,103 0,057 Alter 0,484 -0,135 -0,004 -0,212 -0,175 -0,487 -0,657 -0,052 Ansässig 0,466 -0,277 0,091 0,116 -0,035 -0,085 0,487 -0,662 Anstellung 0,459 -0,304 0,122 -0,017 -0,014 -0,023 0,368 0,739 Ersparnisse 0,404 0,219 0,366 0,436 0,143 0,568 -0,348 -0,017 Schulden -0,067 -0,585 -0,078 -0,281 0,681 0,245 -0,196 -0,075 Kreditkarten -0,123 -0,452 -0,468 0,703 -0,195 -0,022 -0,158 0,058
Wichtigste Ergebnisse: Hauptkomponenten, Ladungsdiagramm

In diesen Ergebnissen weist die erste Hauptkomponente starke positive Assoziationen mit „Alter“, „Ansässig“, „Anstellung“ und „Ersparnisse“ auf, diese Komponente misst also in erster Linie die langfristige finanzielle Stabilität. Die zweite Komponente weist starke negative Assoziationen mit „Schulden“ und „Kreditkarten“ auf, diese Komponente misst also in erster Linie die Bonität eines Antragstellers. Die dritte Komponente weist starke negative Assoziationen mit „Einkommen“, „Ausbildung“ und „Kreditkarten“ auf, diese Komponente misst also in erster Linie die Situation eines Antragstellers hinsichtlich Bildung und Einkommen.

Das Ladungsdiagramm stellt die Ergebnisse für die ersten beiden Komponenten grafisch dar. „Alter“, „Ansässig“, „Anstellung“ und „Ersparnisse“ weisen große positive Ladungen für Komponente 1 auf, diese Komponente misst also die langfristige finanzielle Stabilität. „Schulden“ und „Kreditkarten“ weisen große negative Ladungen für Komponente 2 auf, diese Komponente misst also in erster Linie die Bonität eines Bewerbers.

Schritt 3: Identifizieren von Ausreißern

Verwenden Sie das Diagramm der Ausreißer, um Ausreißer zu identifizieren. Jeder Punkt, der oberhalb der Referenzlinie liegt, stellt einen Ausreißer dar. Ausreißer können die Ergebnisse Ihrer Analyse wesentlich beeinflussen. Wenn Sie einen Ausreißer in den Daten identifiziert haben, sollten Sie diese Beobachtung daher untersuchen, um ihre Ursache zu ermitteln. Korrigieren Sie sämtliche Dateneingabe- oder Messfehler. Erwägen Sie, Daten zu entfernen, die auf Ausnahmebedingungen zurückzuführen sind, und die Analyse zu wiederholen.

Wichtigstes Ergebnis: Diagramm der Ausreißer

In diesen Ergebnissen sind keine Ausreißer vorhanden. Alle Punkte liegen unterhalb der Referenzlinie.

Tipp

Zeigen Sie mit dem Mauszeiger auf einen beliebigen Punkt im Diagramm der Ausreißer, um die Beobachtung zu identifizieren. Verwenden Sie Editor > Markieren, um mehrere Ausreißer im Diagramm zu markieren und die Beobachtungen im Arbeitsblatt zu kennzeichnen.

Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien