Führen Sie die folgenden Schritte aus, um die Daten in einen Trainingsdatensatz und einen Testdatensatz zu unterteilen.
- Wählen Sie in der Dropdown-Liste die Option Validierung mit einem Testdatensatz aus.
- Wählen Sie eine der folgenden Optionen aus, um anzugeben, ob ein Teil der Zeilen nach dem Zufallsprinzip oder anhand einer ID-Spalte ausgewählt werden soll.
- Zufallsfraktion der Zeilen als Testdatensatz
auswählen: Wählen Sie diese Option aus, wenn Minitab den Testdatensatz nach dem Zufallsprinzip auswählen soll. Sie können angeben, wie viele Daten in den Testdatensatz aufgenommen werden sollen. In den meisten Fällen funktioniert der Standardwert 0,3 gut. Es empfiehlt sich, eine ausreichende Menge von Daten in den Testdatensatz aufzunehmen, um das Modell gut bewerten zu können. Wenn Sie hinsichtlich der Form des Modells nicht sicher sind, ermöglicht ein größerer Testdatensatz eine stärkere Validierung. Sie sollten auch eine ausreichende Menge von Daten in den Trainingsdatensatz aufnehmen, um das Modell gut zu schätzen. In der Regel benötigen Modelle mit mehr Prädiktoren für die Schätzung mehr Trainingsdaten.
- Trainings-/Test-Teilung nach ID-Spalte
definieren: Wählen Sie diese Option aus, um selbst die Zeilen auszuwählen, die in die Teststichprobe aufgenommen werden sollen. Geben Sie im Feld ID-Spalte die Spalte ein, die angibt, welche Zeilen für die Teststichprobe verwendet werden sollen. Die ID-Spalte darf nur zwei Werte enthalten. Wählen Sie im Feld Stufe für
Testdatensatz aus, welche Stufe als Teststichprobe verwendet werden soll.
- (Optional) Aktivieren Sie ID-Spalte
für Trainings-/Test-Teilung speichern, um die ID-Spalte zu speichern.