Angeben der Codierung für kategoriale und stetige Variablen für Regressionsmodell anpassen und Lineare Regression

Statistik > Regression > Regression > Regressionsmodell anpassen > Kodierung

Predictive Analytics-Modul > Lineare Regression > Kodierung

In diesem Thema

Kodierung für kategoriale Variablen
Stetige Prädiktoren standardisieren

Kodierung für kategoriale Variablen

Kodierung für kategoriale Prädiktoren

Um die Analyse durchführen zu können, muss Minitab die kategorialen Prädiktoren anhand einer von zwei Methoden neu kodieren. Erwägen Sie, die Methode zu ändern, je nachdem, ob die Stufen des Prädiktors mit dem Gesamtmittelwert oder mit dem Mittelwert der Referenzstufe verglichen werden sollen. Der Test des Gesamteffekts des Prädiktors wird durch das Kodierungsschema nicht geändert. Weitere Informationen finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.

(-1, 0, +1): Wählen Sie diese Option aus, damit die Differenz zwischen den einzelnen Stufenmittelwerten und dem Gesamtmittelwert geschätzt wird.
(1, 0): Wählen Sie diese Option aus, damit die Differenz zwischen den einzelnen Stufenmittelwerten und dem Mittelwert der Referenzstufe geschätzt wird. Wenn Sie das (1, 0)-Kodierungsschema auswählen, wird die Tabelle der Referenzstufen im Dialogfeld aktiviert.

Tabelle der Referenzstufen

Kategorialer Prädiktor

In dieser Tabellenspalte werden die Namen aller kategorialen Prädiktoren im Modell angezeigt. In dieser Spalte können keine Eingaben vorgenommen werden.

Referenzstufe

Minitab vergleicht die Mittelwerte der Nicht-Referenzstufe mit der Referenzstufe. Das Ändern der Referenzstufe wirkt sich nicht auf die Gesamtsignifikanz aus, u. U. fällt die Interpretation der Koeffizienten jedoch aussagekräftiger aus.

Für Prädiktoren mit (1, 0)-Kodierung legt Minitab standardmäßig folgende Referenzstufen auf der Grundlage des Datentyps fest:

Für kategoriale numerische Prädiktoren ist die Referenzstufe die Stufe mit dem kleinsten numerischen Wert.
Für kategoriale Datums-/Uhrzeitprädiktoren ist die Referenzstufe die Stufe mit dem frühesten Datums-/Uhrzeitwert.
Für kategoriale Textprädiktoren ist die Referenzstufe die Stufe, die an erster Stelle in der Wertereihenfolge steht, bei der es sich standardmäßig um die alphabetische Reihenfolge handelt. Weitere Informationen zum Ändern der Wertereihenfolge für Textvariablen finden Sie unter Ändern der Anzeigereihenfolge von Textwerten in der Minitab-Ausgabe.

Stetige Prädiktoren standardisieren

Sie können die stetigen Prädiktoren im Modell standardisieren. Mit den standardisierten Prädiktoren wird lediglich das Modell angepasst, und sie werden nicht im Arbeitsblatt gespeichert.

Durch das Standardisieren der stetigen Prädiktoren kann die Interpretation des Modells in Bezug auf bestimmte Bedingungen verbessert werden.

Zentrieren der stetigen Prädiktoren durch Subtrahieren des Mittelwerts: Auf diese Weise lässt sich die Multikollinearität reduzieren, was die Genauigkeit der Schätzwerte für die Koeffizienten verbessert. Diese Methode ist hilfreich, wenn Ihr Modell stark korrelierte Prädiktoren, Terme höherer Ordnung und Wechselwirkungsterme enthält. Jeder Koeffizient stellt die erwartete Änderung der Antwortvariablen bei einer Änderung des Prädiktors um eine Einheit dar, wobei die ursprüngliche Messskala verwendet wird.
Standardisieren der Skala der stetigen Prädiktoren durch Dividieren durch die Standardabweichung: Diese Methode macht die Spannweiten der Prädiktoren homogener, so dass Sie die Größe der Koeffizienten vergleichen können. Dieser Ansatz ist hilfreich, wenn Sie wissen möchten, welche Prädiktoren einen größeren Effekt haben, und gleichzeitig die Unterschiede bei der Skala berücksichtigt werden sollen. Jeder Koeffizient stellt jedoch die erwartete Änderung der Antwortvariablen bei einer Änderung des Prädiktors um eine Standardabweichung dar.

Verwenden Sie zum Standardisieren der stetigen Prädiktoren eine der folgenden Methoden:

Nicht standardisieren: Für die stetigen Prädiktoren werden die ursprünglichen Daten verwendet.
Kodierung von -1 bzw. +1 für tiefe bzw. hohe Stufe festlegen: Wählen Sie diese Option aus, um die Prädiktoren zu zentrieren und sie auf einer Skala zu platzieren, die Vergleiche zulässt. Diese Methode wird von Minitab in der Versuchsplanung (DOE) verwendet. Alle Datenwerte zwischen den angegebenen Tief- und Hoch-Werten werden so transformiert, dass sie zwischen −1 und +1 liegen. Geben Sie in der Tabelle Tief- und Hoch-Werte ein, oder verwenden Sie die standardmäßigen Minimal- und Maximalwerte aus der Stichprobe.

Stetiger Prädiktor

Hier werden die Namen aller stetigen Prädiktoren im Modell angezeigt. In dieser Spalte können keine Eingaben vorgenommen werden.

Tief

Geben Sie einen Wert ein, der als −1 kodiert werden soll. Der Standardwert ist der Minimalwert in der Stichprobe.

Hoch

Geben Sie einen Wert ein, der als +1 kodiert werden soll. Der Standardwert ist der Maximalwert in der Stichprobe.
Mittelwert subtrahieren, dann durch Standardabweichung dividieren: Wählen Sie diese Option aus, um die Prädiktoren zu zentrieren und sie auf einer Skala zu platzieren, die Vergleiche zulässt.
Mittelwert subtrahieren: Wählen Sie diese Option aus, um die Prädiktoren zu zentrieren.
Durch Standardabweichung dividieren: Für alle Prädiktoren wird eine Skala verwendet, die Vergleiche zulässt.
Angegebenen Wert subtrahieren, dann durch einen weiteren Wert dividieren: Geben Sie andere Werte als die Schätzwerte für Mittelwert und Standardabweichung aus der Stichprobe an.

Stetiger Prädiktor

Hier werden die Namen aller stetigen Prädiktoren im Modell angezeigt. In dieser Spalte können keine Eingaben vorgenommen werden.

Subtrahieren

Geben Sie den Wert ein, der von jedem stetigen Prädiktor subtrahiert werden soll.

Dividieren durch

Geben Sie den Wert ein, durch den Minitab das Ergebnis der Subtraktion dividieren soll.