Durchführen einer schrittweisen Regression für Poisson-Modell anpassen

Statistik > Regression > Poisson-Regression > Poisson-Modell anpassen > Schrittweise

Methode

Fügt dem Modell schrittweise Terme hinzu bzw. entfernt schrittweise Terme aus dem Modell, um eine nützliche Teilmenge von Termen zu ermitteln. Bei Auswahl eines schrittweisen Verfahrens sind die im Dialogfeld Modell angegebenen Terme potenzielle Terme für das endgültige Modell. Weitere Informationen finden Sie unter Verwenden der schrittweisen Regression und der Regression der besten Teilmengen.

Geben Sie die Methode an, mit der Minitab das Modell anpasst.
  • Keine: Das Modell wird mit allen Termen angepasst, die Sie im Dialogfeld Modell angeben.
  • Schrittweise: Bei dieser Methode wird von einem leeren Modell ausgegangen, oder es werden die Terme aufgenommen, die Sie für die Aufnahme in das Anfangsmodell oder jedes Modell angegeben haben. Anschließend fügt Minitab in jedem Schritt einen Term hinzu bzw. entfernt einen Term. Sie können Terme angeben, die im Anfangsmodell enthalten sein oder zwingend in jedes Modell aufgenommen werden sollen. Minitab beendet den Vorgang, wenn alle nicht im Modell enthaltenen Variablen p-Werte aufweisen, die größer als der angegebene Wert von Alpha für Aufnahme sind, und wenn alle im Modell enthaltenen Variablen p-Werte aufweisen, die kleiner oder gleich dem angegebenen Wert von Alpha für Ausschluss sind.
  • Vorwärtsauswahl: Bei dieser Methode wird von einem leeren Modell ausgegangen, oder es werden die Terme aufgenommen, die Sie für die Aufnahme in das Anfangsmodell oder jedes Modell angegeben haben. Anschließend fügt Minitab in jedem Schritt den Term mit der größten Signifikanz hinzu. Minitab beendet den Vorgang, wenn alle nicht im Modell enthaltenen Variablen p-Werte aufweisen, die größer als der angegebene Wert von Alpha für Aufnahme sind.
  • Rückwärtselimination: Bei dieser Methode wird mit allen potenziellen Termen im Modell begonnen, und es wird in jedem Schritt der am wenigsten signifikante Term entfernt. Minitab beendet den Vorgang, wenn alle im Modell enthaltenen Variablen p-Werte aufweisen, die kleiner oder gleich dem angegebenen Wert von Alpha für Ausschluss sind.
  • Vorwärts-Informationskriterium: Beim Verfahren des vorwärts gerichteten Informationskriteriums wird dem Modell bei jedem Schritt der Term mit dem niedrigsten p-Wert hinzugefügt. Bei jedem Schritt können weitere Terme in das Modell aufgenommen werden, wenn die Einstellungen für die Analyse die Berücksichtigung nicht hierarchischer Terme zulassen, aber erfordern, dass alle Modelle hierarchisch sind. Minitab berechnet das Informationskriterium für jeden Schritt. In den meisten Fällen wird das Verfahren fortgesetzt, bis eine der folgenden Bedingungen eintritt:
    • Das Verfahren kann in acht aufeinanderfolgenden Schritten kein neues Minimum für das Kriterium ermitteln.
    • Das Verfahren passt das vollständige Modell an.
    • Das Verfahren passt ein Modell an, das einen Freiheitsgrad für Fehler lässt.
    Wenn Sie Einstellungen für das Verfahren festlegen, nach denen bei jedem Schritt ein hierarchisches Modell erforderlich ist und jeweils nur ein Term aufgenommen werden darf, wird das Verfahren fortgesetzt, bis es entweder das vollständige Modell oder ein Modell anpasst, das einen Freiheitsgrad für Fehler lässt. Minitab zeigt die Ergebnisse für die Analyse des Modells mit dem kleinsten Wert für das ausgewählte Informationskriterium (AICc oder BIC) an.
  • Vorwärtsauswahl mit Testdatensatz: Das Verfahren ähnelt der Vorwärtsauswahl. Am Ende jedes Schritts berechnet Minitab das R2 für den Test. Am Ende des Verfahrens der Vorwärtsauswahl ist das Modell mit dem größten R2 für den Test das endgültige Modell.

    Das Verfahren wird unter denselben Bedingungen wie das Verfahren mit dem Vorwärts-Informationskriterium beendet.

Hinweis

Es kann von Einschränkungen im Hinblick auf die Hierarchie für die Modelle abhängen, welche Terme in das endgültige Modell eingebunden werden. Weitere Informationen finden Sie unten im Thema „Hierarchie“.

Mögliche Terme

Zeigt die Terme an, die mit der Prozedur ausgewertet werden. Indikatoren (E oder I) neben einem Term in der Liste zeigen an, wie die Prozedur den jeweiligen Term behandelt. Der ausgewählte Wert für Methode bestimmt die Anfangseinstellungen in der Liste. Mit den zwei Schaltflächen unten können Sie ändern, wie die Prozedur die Terme behandelt. Wenn Sie diese Schaltflächen nicht verwenden, kann die Prozedur den Term je nach seinem p-Wert in das Modell aufnehmen bzw. aus diesem entfernen.
  • E = Term in jedes Modell einbinden: Wählen Sie einen Term aus, und klicken Sie auf diese Schaltfläche, um die Aufnahme des Terms in jedem Modell unabhängig von seinem p-Wert zu erzwingen. Klicken Sie erneut auf die Schaltfläche, um diese Einstellung aufzuheben.
  • I = Term in Anfangsmodell einbinden: Wählen Sie einen Term aus, und klicken Sie auf diese Schaltfläche, um den Term in das Anfangsmodell aufzunehmen. Die Prozedur kann den betreffenden Term ausschließen, wenn sein p-Wert zu hoch ist. Klicken Sie erneut auf die Schaltfläche, um diese Einstellung aufzuheben. Diese Schaltfläche ist nur verfügbar, wenn Sie Schrittweise in Methode auswählen.

Alpha für Aufnahme und Ausschluss

Alpha für Aufnahme
Geben Sie den Alpha-Wert ein, mit dem Minitab bestimmt, ob ein Term in das Modell aufgenommen werden kann. Sie können diesen Wert festlegen, wenn Sie Schrittweise oder Vorwärtsauswahl in Methode auswählen.
Alpha für Ausschluss
Geben Sie den Alpha-Wert ein, mit dem Minitab bestimmt, ob ein Term aus dem Modell entfernt wird. Sie können diesen Wert festlegen, wenn Sie Schrittweise oder Rückwärtselimination in Methode auswählen.

Kriterium

Geben Sie an, welches Informationskriterium bei der Vorwärtsauswahl verwendet werden soll.

Sowohl AICc als auch BIC werten die Likelihood des Modells aus und wenden dann einen Abzug für das Hinzufügen von Termen zum Modell an. Durch den Abzug wird die Tendenz zur Überanpassung des Modells an die Stichprobendaten reduziert. Durch diese Reduzierung kann ein Modell zustande kommen, das insgesamt eine bessere Leistung erbringt.

Als Faustregel gilt: Wenn die Anzahl der Parameter im Verhältnis zum Stichprobenumfang klein ist, ist der Abzug für das Hinzufügen der einzelnen Parameter für BIC größer als für AICc. In diesen Fällen ist das Modell, bei dem BIC minimiert wird, tendenziell kleiner als das Modell, bei dem AICc minimiert wird.

In einigen gängigen Fällen, z. B. bei Screening-Versuchsplänen, ist die Anzahl der Parameter im Verhältnis zum Stichprobenumfang in der Regel groß. In diesen Fällen ist das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird. Bei einem definitiven Screening-Versuchsplan mit 13 Durchläufen ist beispielsweise in der Gruppe der Modelle mit 6 oder mehr Parametern das Modell, bei dem AICc minimiert wird, tendenziell kleiner als das Modell, bei dem BIC minimiert wird.

Weitere Informationen zum AICc und BIC finden Sie in Burnham und Anderson.1

Angeben der Validierung für Vorwärtsauswahl mit Testdatensatz

Hinweis

Einstellungen für die Validierung befinden sich auch im Unterdialogfeld Validierung. Wenn Sie die Einstellungen ändern, aktualisiert Minitab automatisch die Einstellungen an beiden Orten.

Wählen Sie eine der folgenden Optionen aus, um anzugeben, ob ein Teil der Zeilen nach dem Zufallsprinzip oder ein Teil der Zeilen anhand einer ID-Spalte ausgewählt werden soll.
Zufallsfraktion der Zeilen als Testdatensatz auswählen
Wählen Sie diese Option aus, wenn Minitab den Testdatensatz nach dem Zufallsprinzip auswählen soll. Sie können angeben, wie viele Daten in den Testdatensatz aufgenommen werden sollen. In den meisten Fällen funktioniert der Standardwert 0,3 gut. Es empfiehlt sich, eine ausreichende Menge von Daten in den Testdatensatz aufzunehmen, um das Modell gut bewerten zu können. Wenn Sie hinsichtlich der Form des Modells nicht sicher sind, ermöglicht ein größerer Testdatensatz eine stärkere Validierung. Sie sollten auch eine ausreichende Menge von Daten in den Trainingsdatensatz aufnehmen, um das Modell gut zu schätzen. In der Regel benötigen Modelle mit mehr Prädiktoren für die Schätzung mehr Trainingsdaten.
Trainings-/Test-Teilung nach ID-Spalte definieren
Wählen Sie diese Option aus, um die Zeilen auszuwählen, die in die Teststichprobe aufgenommen werden sollen. Geben Sie in ID-Spalte die Spalte ein, die angibt, welche Zeilen für die Teststichprobe verwendet werden sollen. Die ID-Spalte darf nur zwei Werte enthalten. Wählen Sie in Stufe für Testdatensatz aus, welche Stufe als Teststichprobe verwendet werden soll.

Hierarchie

Sie können bestimmen, wie Minitab die Modellhierarchie während einer schrittweisen Regression erzwingt. Die Schaltfläche Hierarchie ist deaktiviert, wenn Sie im Dialogfeld Modell ein nicht hierarchisches Modell angeben.

In einem hierarchischen Modell sind alle Terme niedriger Ordnung, aus denen sich die Terme höherer Ordnung zusammensetzen, ebenfalls im Modell enthalten. Ein Modell, das den Wechselwirkungsterm A*B*C enthält, ist beispielsweise hierarchisch, wenn es diese Terme umfasst: A, B, C, A*B, A*C und B*C.

Die Modelle müssen nicht zwangsläufig hierarchisch sein. Im Allgemeinen können Sie Terme niedriger Ordnung entfernen, wenn sie nicht signifikant sind, es sei denn, Sie entscheiden aufgrund Ihrer Sachkenntnis, sie beizubehalten. Modelle mit zu vielen Termen können relativ unpräzise sein und die Fähigkeit mindern, die Werte neuer Beobachtungen zu prognostizieren.

Befolgen Sie die untenstehenden Tipps:
  • Passen Sie zuerst ein hierarchisches Modell an. Nicht signifikante Terme können Sie später entfernen.
  • Wenn Sie die stetigen Prädiktoren standardisieren, passen Sie ein hierarchisches Modell an, um eine Gleichung in nicht kodierten (oder natürlichen) Einheiten zu erstellen.
  • Wenn Ihr Modell kategoriale Variablen enthält, lassen sich die Ergebnisse einfacher interpretieren, wenn zumindest die kategorialen Terme hierarchisch sind.
Hierarchisches Modell
Wählen Sie aus, ob beim Verfahren für die schrittweise Regression ein hierarchisches Modell erstellt werden muss.
  • Bei jedem Schritt ist ein hierarchisches Modell erforderlich: Minitab kann nur Terme hinzufügen oder entfernen, mit denen die Hierarchie gewahrt bleibt.
  • Terme am Ende hinzufügen, damit das Modell hierarchisch wird: Zunächst folgt Minitab den Standardregeln des Verfahrens für die schrittweise Regression. Im letzten Schritt werden die Terme hinzugefügt, mit denen ein hierarchisches Modell erzeugt wird, selbst wenn deren p-Werte größer als der Wert von Alpha für Aufnahme sind. Wenn Sie diese Option auswählen, während Methode den Wert Vorwärts-Informationskriterium aufweist, zeigt Minitab einen Fehler an. Um ein hierarchisches Modell zu erhalten, für das das Kriterium bei den Modellen in den Schritten minimiert wird, wählen Sie Bei jedem Schritt ist ein hierarchisches Modell erforderlich aus.
  • Hierarchisches Modell ist nicht erforderlich: Das endgültige Modell muss nicht hierarchisch sein. Die Terme werden von Minitab ausschließlich gemäß den Regeln des Verfahrens der schrittweisen Regression hinzugefügt und entfernt.
Hierarchie für die folgenden Terme erforderlich
Wenn Sie ein hierarchisches Modell benötigen, wählen Sie die Typen von Termen aus, die hierarchisch sein müssen.
  • Alle Terme: Terme, die stetige und/oder kategoriale Variablen umfassen, müssen hierarchisch sein.
  • Terme mit kategorialen Prädikatoren: Nur Terme, die kategoriale Variablen umfassen, müssen hierarchisch sein.
Wie viele Terme können in jedem Schritt aufgenommen werden
Wenn bei jedem Schritt die Hierarchie gewahrt bleiben soll, wählen Sie die Anzahl der Terme aus, die Minitab pro Schritt hinzufügen kann, damit die Hierarchie erhalten bleibt.
  • In jedem Schritt kann höchstens ein Term aufgenommen werden: Ein Term höherer Ordnung kann nur in das Modell aufgenommen werden, wenn die Hierarchie beim Aufnehmen dieses einzelnen Terms erhalten bleibt. Sämtliche Terme niedriger Ordnung, die den Term höherer Ordnung bilden, müssen bereits im Modell vorhanden sein.
  • Zum Erhalten der Hierarchie können zusätzliche Terme aufgenommen werden: Ein Term höherer Ordnung kann dem Modell selbst dann hinzugefügt werden, wenn dadurch ein nicht hierarchisches Modell entsteht. Die zum Konstruieren eines hierarchischen Modells benötigten Terme werden jedoch auch dann hinzugefügt, wenn ihre p-Werte größer als der Wert von Alpha für Aufnahme sind.

Tabelle mit Details zur Modellauswahl anzeigen

Geben Sie an, welche Informationen zum schrittweisen Verfahren angezeigt werden sollen.
  • Details zur Methode: Es werden der Typ des schrittweisen Verfahrens und die Alpha-Werte für Aufnahme und/oder Ausschluss eines Prädiktors im Modell angezeigt.
  • Details für jeden Schritt einbeziehen: Es werden die Koeffizienten, p-Werte und Statistiken zur Zusammenfassung des Modells für jeden Schritt des Verfahrens angezeigt.

Grafik von R-Quadrat vs. Schritt anzeigen

Wenn Sie Vorwärtsauswahl mit Testdatensatz auswählen, wird für jeden Schritt in der Vorwärtsauswahl ein Diagramm des R2 der Abweichung für das Training und den Test angezeigt. In der Regel wird das Diagramm verwendet, um zu ermitteln, ob einfachere Modelle ähnliche Testwerte aufweisen.

1 Burnham, K. P., & Anderson, D. R. (2004). Multimodel inference: Understanding AIC and BIC in model selection. Sociological Methods & Research, 33(2), 261-304. doi:10.1177/0049124104268644