Auswählen der Analyseoptionen für Regression der partiellen kleinsten Quadrate

Statistik > Regression > Partielle kleinste Quadrate > Optionen
Kreuzvalidierung

Bei der Kreuzvalidierung werden die Prognosefähigkeiten möglicher Modelle berechnet, um Sie beim Ermitteln der geeigneten Anzahl von Komponenten für das Modell zu unterstützen. Verwenden Sie die Kreuzvalidierung, um die optimale Anzahl von Komponenten für Ihre Daten zu bestimmen. Wenn die Daten mehrere Antwortvariablen enthalten, validiert Minitab die Komponenten für alle Antwortvariablen gleichzeitig. Weitere Informationen finden Sie unter Kreuzvalidierung in der PLS-Regression.

Minitab bietet drei Methoden für die Kreuzvalidierung:
  • Keine: Es wird keine Kreuzvalidierung durchgeführt.
  • Eins auslassen: Verwenden Sie diese Option, um mögliche Modelle zu berechnen, wobei jedes Mal eine Beobachtung entfernt wird. Bei großen Datensätzen kann diese Methode sehr zeitaufwendig sein, da das Modell so oft neu berechnet wird wie Beobachtungen vorliegen.
  • Gruppe folgender Größe auslassen: Geben Sie die Anzahl der Beobachtungen an, die bei jeder Neuberechnung des Modells entfernt werden sollen. Da bei dieser Methode reduziert wird, wie häufig das Modell neu berechnet werden muss, eignet sie sich besonders bei großen Datensätzen.
  • Gemäß folgender Spalte auslassen: Verwenden Sie diese Option, damit die Modelle berechnet werden, indem gleichzeitig alle Beobachtungen entfernt werden, die in der Gruppenbezeichnerspalte die gleiche Zahl enthalten. Bei dieser Methode können Sie angeben, welche Beobachtungen gemeinsam entfernt werden. Wenn z. B. die Gruppenbezeichnerspalte die Zahlen 1, 2 und 3 enthält, werden bei der Neuberechnung des Modells alle Beobachtungen mit der Zahl 1 gemeinsam entfernt. Bei der folgenden Neuberechnung werden alle Beobachtungen mit der Zahl 2 entfernt usw.
Kodierungstyp für kategoriale Prädiktoren
Zum Durchführen der Analyse muss Minitab die kategorialen Prädiktoren neu kodieren; hierbei gibt es zwei Methoden. Erwägen Sie, die Methode zu ändern, je nachdem, ob die Stufen des Prädiktors mit dem Gesamtmittelwert oder mit dem Mittelwert der Referenzstufe verglichen werden sollen. Weitere Informationen finden Sie unter Kodierungsschemas für kategoriale Prädiktoren.
  • (1, 0): Wählen Sie diese Option aus, damit die Differenz zwischen den einzelnen Stufenmittelwerten und dem Mittelwert der Referenzstufe geschätzt wird. Wenn Sie das (1; 0)-Kodierungsschema auswählen, können Sie die Referenzstufe angeben.
  • (-1, 0, +1): Wählen Sie diese Option aus, damit die Differenz zwischen den einzelnen Stufenmittelwerten und dem Gesamtmittelwert geschätzt wird.
Referenzstufe (kategorialen Prädiktor gefolgt von Stufe eingeben)
Geben Sie die Referenzstufe ein, indem Sie die Spalte des kategorialen Prädiktors gefolgt von der Referenzstufe eingeben. (Stufen, die Text- oder Datums-/Uhrzeitdaten sind, müssen in Anführungszeichen eingeschlossen werden.) Eine Referenzstufe kann nur bei Verwendung der (1; 0)-Kodierung zugewiesen werden. Minitab legt standardmäßig je nach Datentyp die folgenden Referenzstufen fest:
  • Für numerische kategoriale Prädiktoren ist die Referenzstufe die Stufe mit dem kleinsten numerischen Wert.
  • Für kategoriale Datums-/Uhrzeitprädiktoren ist die Referenzstufe die Stufe mit dem frühesten Datums-/Uhrzeitwert.
  • Für kategoriale Textprädiktoren ist die Referenzstufe die erste Stufe in alphabetischer Reihenfolge.