Was ist die schrittweise Regression?

Die schrittweise Regression ist ein automatisiertes Werkzeug, mit dem in den explorativen Phasen der Modellerstellung eine nützliche Teilmenge von Prädiktoren bestimmt wird. Bei jedem Schritt des Verfahrens wird systematisch die signifikanteste Variable hinzugefügt oder die am wenigsten signifikante Variable entfernt.

Beispielsweise erfasst ein auf dem Wohnungsmarkt tätiges Beratungsunternehmen Daten zu den Wohnungsverkäufen im zurückliegenden Jahr und möchte auf dieser Grundlage die zukünftigen Verkaufspreise prognostizieren. Bei mehr als 100 Prädiktorvariablen kann das Ermitteln der signifikantesten Modelle mit hohem Zeitaufwand verbunden sein. Die Minitab-Funktion „Schrittweise Regression“ gibt als Ausgangspunkt automatisch die signifikantesten Modelle sowie die Werte für das R2, das korrigierte R2, das prognostizierte R2, S und Mallows-Cp aus.

Gängige Verfahren der schrittweisen Regression

  • Bei der schrittweisen Regression nach dem Standardverfahren werden in jedem Schritt nach Bedarf Prädiktoren hinzugefügt und entfernt. Minitab beendet das Verfahren, sobald alle Variablen, die nicht im Modell enthalten sind, p-Werte aufweisen, die größer als der angegebene Alpha-für-Aufnahme-Wert sind, und alle Variablen, die im Modell enthalten sind, p-Werte aufweisen, die kleiner oder gleich dem angegebenen Alpha-für-Ausschluss-Wert sind.
  • Die Vorwärtsauswahl beginnt mit einem leeren Modell, und Minitab fügt in jedem Schritt den signifikantesten Term hinzu. Minitab beendet das Verfahren, sobald alle Variablen, die nicht im Modell enthalten sind, p-Werte aufweisen, die größer als der angegebene Alpha-für-Aufnahme-Wert sind.
  • Bei der Rückwärtselimination sind anfangs alle Prädiktoren im Modell enthalten, und Minitab entfernt in jedem Schritt die am wenigsten signifikante Variable. Minitab beendet das Verfahren, sobald alle Variablen, die im Modell enthalten sind, p-Werte aufweisen, die kleiner oder gleich dem angegebenen Alpha-für-Ausschluss-Wert sind.

Probleme bei der schrittweisen Regression

  • Wenn zwei Prädiktorvariablen stark korrelieren, ist am Ende möglicherweise nur eine im Modell enthalten, obwohl beide wichtig sein können.
  • Da bei diesem Verfahren viele Modelle angepasst werden, erfolgt möglicherweise eine Auswahl von Modellen, die lediglich zufällig gut an die Daten angepasst sind.
  • Die schrittweise Regression führt für eine bestimmte Anzahl von Prädiktoren möglicherweise nicht in allen Fällen zu einem Modell mit dem größten möglichen Wert für das R2.
  • Bei automatischen Verfahren kann vorhandenes Expertenwissen hinsichtlich der Daten nicht berücksichtigt werden. Daher ist das ausgewählte Modell aus praktischer Sicht nicht unbedingt auch das optimale Modell.
Durch Ihre Nutzung dieser Website stimmen Sie zu, dass Cookies verwendet werden. Cookies dienen zu Analysezwecken und zum Bereitstellen personalisierter Inhalte.  Lesen Sie unsere Richtlinien