Überlegungen zu Daten für Nichtlineare Regression

Befolgen Sie beim Erfassen von Daten, Durchführen der Analyse und Interpretieren der Ergebnisse die folgenden Richtlinien, um sicherzustellen, dass die Ergebnisse gültig sind.

Die Prädiktoren können stetig oder kategorial sein

Eine stetige Variable kann gemessen und geordnet werden, und sie kann zwischen zwei beliebigen Werten eine unendliche Anzahl von Werten annehmen. Die Durchmesser einer Stichprobe von Reifen sind beispielsweise eine stetige Variable.

Kategoriale Variablen umfassen eine endliche, zählbare Anzahl von Kategorien oder eindeutigen Gruppen. Kategoriale Daten müssen nicht zwangsläufig eine logische Reihenfolge aufweisen. Zu den kategorialen Prädiktoren zählen beispielsweise Geschlecht, Materialtyp und Zahlungsmethode.

Wenn Sie über eine diskrete Variable verfügen, können Sie entscheiden, ob diese als stetiger oder als kategorialer Prädiktor behandelt werden soll. Ein diskrete Variable kann gemessen und geordnet werden, kann jedoch nur eine zählbare Anzahl von Werten annehmen. Die Anzahl der zu einem Haushalt zählenden Personen ist beispielsweise eine diskrete Variable. Die Entscheidung, eine diskrete Variable als stetig oder als kategorial zu behandeln, hängt von der Anzahl der Stufen sowie vom Zweck der Analyse ab.

Wenn Sie über mindestens einen kategorialen Prädiktor verfügen, wandeln Sie die kategorialen Prädiktoren in Indikatorvariablen um, ehe Sie diese Analyse durchführen. Um die kategorialen Prädiktoren umzuwandeln, verwenden Sie Indikatorvariablen erstellen.

Die Antwortvariable sollte stetig sein

Wenn die Antwortvariable kategorial ist, besteht eine geringere Wahrscheinlichkeit, dass das Modell die Annahmen der Analyse erfüllt, die vorliegenden Daten genau beschreibt oder eine Grundlage für nützliche Prognosen darstellt.

Wenn für Ihre Daten keine nichtlineare Funktion erforderlich ist, können Sie die folgenden Alternativanalysen erwägen.

  • Wenn die Antwortvariable zwei Kategorien enthält, z. B. „Bestanden“ und „Nicht bestanden“, verwenden Sie Binäres logistisches Modell anpassen.
  • Wenn die Antwortvariable drei oder mehr Kategorien mit einer natürlichen Rangfolge aufweist, z. B. „Starke Ablehnung“, „Ablehnung“, „Neutral“, „Zustimmung“ und „Starke Zustimmung“, verwenden Sie Ordinale Logistische Regression.
  • Wenn die Antwortvariable drei oder mehr Kategorien ohne natürliche Rangfolge aufweist, z. B. Kratzer, Delle und Riss, verwenden Sie Nominale Logistische Regression.
  • Wenn mit der Antwortvariablen Ereignishäufigkeiten gezählt werden, z. B. die Anzahl der Fehler, verwenden Sie Poisson-Modell anpassen.
Die Modellfunktion muss die Beziehung zwischen der Antwortvariablen und den Prädiktorvariablen genau beschreiben
Welche Modellfunktion Sie auswählen, hängt häufig von bereits vorhandenen Kenntnissen über die Kurvenform der Antwortvariablen oder dem Verhalten physikalischer und chemischer Eigenschaften im System ab. Zu den möglichen nichtlinearen Formen gehören konkave, konvexe, sigmoidale (S) und asymptotische Kurven sowie Kurven für exponentielles Wachstum oder exponentielle Rückgänge. Sie müssen die Funktion angeben, die sowohl den Anforderungen Ihrer bereits vorhandenen Kenntnisse als auch den Residuendiagrammen entspricht.
Sie müssen akzeptable Startwerte angeben
Die Parameter werden mit einem iterativen Algorithmus geschätzt, bei dem die Parameterschätzwerte systematisch korrigiert werden, um die Summe der quadrierten Fehler (SSE) zu reduzieren. Bei einigen Modellfunktionen und Datensätzen können die Startwerte die Ergebnisse erheblich beeinflussen.
Orientieren Sie sich bei der Datenerfassung an optimalen Vorgehensweisen
Befolgen Sie die folgenden Richtlinien, um sicherzustellen, dass Sie gültige Ergebnisse erhalten:
  • Vergewissern Sie sich, dass die Daten repräsentativ für die Grundgesamtheit von Interesse sind.
  • Erfassen Sie eine ausreichende Datenmenge, um die notwendige Präzision zu erzielen.
  • Messen Sie Variablen so genau und präzise wie möglich.
  • Zeichnen Sie die Daten in der Reihenfolge auf, in der sie erfasst werden.
Das Modell sollte gut an die Daten angepasst sein

Wenn das Modell nicht gut an die Daten angepasst ist, können die Ergebnisse irreführend sein. Bestimmen Sie anhand der Residuendiagramme und der zusammenfassenden Statistiken zum Modell in der Ausgabe, wie gut das Modell an die Daten angepasst ist.