Überlegungen zu Daten für Allgemeines lineares Modell anpassen

Befolgen Sie beim Erfassen von Daten, Durchführen der Analyse und Interpretieren der Ergebnisse die folgenden Richtlinien, um sicherzustellen, dass die Ergebnisse gültig sind.

Die Daten müssen mindestens einen kategorialen Faktor enthalten.

Bei den kategorialen Faktoren kann es sich um gekreuzte oder geschachtelte Faktoren sowie um feste und zufällige Faktoren handeln.

Für ein Modell mit Zufallsfaktoren verwenden Sie in der Regel Modell mit gemischten Effekten anpassen, damit Sie die die eingeschränkte Maximum-Likelihood (REML) als Schätzmethode verwenden können.
Wenn Sie über einen kategorialen Faktor und keine stetigen Prädiktoren verfügen, können Sie auch Einfache ANOVA verwenden.
Wenn Sie überwiegend über stetige Prädiktorvariablen verfügen, können Sie mit Regressionsmodell anpassen ähnliche Modellergebnisse erhalten.
Wenn Sie über einen oder zwei kategoriale Faktoren verfügen und die Stufenmittelwerte für Daten, die einer Normalverteilung, Binomialverteilung oder Poisson-Verteilung folgen, mit dem Gesamtmittelwert vergleichen möchten, verwenden Sie Mittelwertanalyse.
Wenn Sie die Gleichheit der Standardabweichungen zwischen Gruppen testen möchten, verwenden Sie Test auf gleiche Varianzen.

Weitere Informationen zu Faktoren finden Sie unter Faktoren und Faktorstufen, Was sind Faktoren, gekreuzte Faktoren und geschachtelte Faktoren? und Wodurch unterscheiden sich feste Faktoren und Zufallsfaktoren?.

Die Antwortvariable sollte stetig sein

Wenn die Antwortvariable kategorial ist, besteht eine geringere Wahrscheinlichkeit, dass das Modell die Annahmen der Analyse erfüllt, die vorliegenden Daten genau beschreibt oder eine Grundlage für nützliche Prognosen darstellt.

Wenn Sie über mehrere korrelierende Antwortvariablen sowie über eine gemeinsame Gruppe von Faktoren verfügen, verwenden Sie Allgemeine MANOVA, womit Sie eine größere Trennschärfe erreichen und multivariate Antwortmuster erkennen können.
Wenn die Antwortvariable zwei Kategorien enthält, z. B. „Bestanden“ und „Nicht bestanden“, verwenden Sie Binäres logistisches Modell anpassen.
Wenn die Antwortvariable drei oder mehr Kategorien mit einer natürlichen Rangfolge aufweist, z. B. „Starke Ablehnung“, „Ablehnung“, „Neutral“, „Zustimmung“ und „Starke Zustimmung“, verwenden Sie Ordinale Logistische Regression.
Wenn die Antwortvariable drei oder mehr Kategorien ohne natürliche Rangfolge aufweist, z. B. Kratzer, Delle und Riss, verwenden Sie Nominale Logistische Regression.
Wenn mit der Antwortvariablen Ereignishäufigkeiten gezählt werden, z. B. die Anzahl der Fehler, verwenden Sie Poisson-Modell anpassen.

Jede Beobachtung sollte unabhängig von allen anderen Beobachtungen sein

Wenn die Beobachtungen voneinander abhängen, sind Ihre Ergebnisse möglicherweise ungültig. Untersuchen Sie die folgenden Aspekte, um festzustellen, ob die Beobachtungen unabhängig sind:

Wenn eine Beobachtung keine Informationen über den Wert einer anderen Beobachtung liefert, sind die Beobachtungen unabhängig.
Wenn eine Beobachtung Informationen über den Wert einer anderen Beobachtung liefert, sind die Beobachtungen voneinander abhängig.

Die Stichprobendaten sollten nach dem Zufallsprinzip ausgewählt werden

Mit Zufallsstichproben werden Verallgemeinerungen zu einer Grundgesamtheit angestellt und Schlussfolgerungen zu dieser gezogen. Wenn die Daten nicht nach dem Zufallsprinzip erfasst wurden, stellen die Ergebnisse u. U. nicht die Grundgesamtheit dar.

Orientieren Sie sich bei der Datenerfassung an optimalen Vorgehensweisen

Befolgen Sie die folgenden Richtlinien, um sicherzustellen, dass Sie gültige Ergebnisse erhalten:

Vergewissern Sie sich, dass die Daten repräsentativ für die Grundgesamtheit von Interesse sind.
Erfassen Sie eine ausreichende Datenmenge, um die notwendige Präzision zu erzielen.
Messen Sie Variablen so genau und präzise wie möglich.
Zeichnen Sie die Daten in der Reihenfolge auf, in der sie erfasst werden.

Die Korrelation zwischen den Prädiktoren, die auch als Multikollinearität bezeichnet wird, darf nicht zu stark ausgeprägt sein.

Bei stark ausgeprägter Multikollinearität können Sie u. U. nicht ermitteln, welche Prädiktoren in das Modell eingebunden werden sollten. Bestimmen Sie den Schweregrad der Multikollinearität anhand der Varianzinflationsfaktoren (VIF) in der Koeffiziententabelle der Ausgabe.

Das Modell sollte gut an die Daten angepasst sein

Wenn das Modell nicht gut an die Daten angepasst ist, können die Ergebnisse irreführend sein. Bestimmen Sie anhand der Residuendiagramme, der Bewertungsstatistiken für ungewöhnliche Beobachtungen und der zusammenfassenden Statistiken zum Modell in der Ausgabe, wie gut das Modell an die Daten angepasst ist.