Überlegungen zu Daten für Bestes Modell ermitteln (stetige Antwort)

Hinweis

Dieser Befehl ist mit Predictive Analytics-Modul verfügbar. Klicken Sie hier, um weitere Informationen zum Aktivieren des Moduls zu erhalten.

Um die Gültigkeit Ihrer Ergebnisse sicherzustellen, befolgen Sie beim Erfassen von Daten, beim Durchführen der Analyse und beim Interpretieren der Ergebnisse die folgenden Richtlinien.

Die Antwortvariable sollte stetig sein
Eine stetige Variable kann gemessen und geordnet werden, und sie kann zwischen zwei beliebigen Werten eine unendliche Anzahl von Werten annehmen. Die Durchmesser einer Stichprobe von Reifen sind beispielsweise eine stetige Variable.

Die Daten für die Antwortvariable müssen numerische Werte sein.

Wenn Ihre Antwortvariable kategorial ist, verwenden Sie Bestes Modell ermitteln (binäre Antwort).

Prädiktorvariablen können stetig oder kategorial sein
Sie können eine Kombination aus stetigen oder kategorialen Prädiktoren verwenden. Die Länge der Spalten für jeden Prädiktor muss jedoch der Länge der Spalte der Antwortvariablen entsprechen. Fehlende Werte sind zulässig.
  • Alle stetigen Prädiktoren müssen numerisch sein.
  • Kategoriale Prädiktoren können Textwerte oder numerische Werte sein.
Bei mehr als 2000 Fällen wird ein Testdatensatz empfohlen

Minitab verwendet die Kreuzvalidierung, um die Modelle zu vergleichen, wenn die Anzahl der Fälle ≤ 2000 liegt. Liegen mehr als 2000 Fälle vor, verwendet Minitab einen Testdatensatz. Wenn der Datensatz groß ist, verkürzt die Validierung mit einem Testset die Zeit für die Analyse der Daten. Weitere Informationen zu den Einstellungen für Validierungsverfahren in Bestes Modell ermitteln (stetige Antwort) finden Sie unter Angeben der Validierungsmethode für Bestes Modell ermitteln (stetige Antwort).

Das Modell sollte gut an die Daten angepasst sein.

Wenn das Modell nicht gut an die Daten angepasst ist, können die Ergebnisse irreführend sein. Alle Modelltypen enthalten Modellzusammenfassungsstatistiken, die die Leistung des Modells beschreiben. Verwenden Sie die Ergebnisse der Kreuzvalidierung oder des Testsatzes, um zu bestimmen, ob das Modell die Antwort gut vorhersagt. Verwenden Sie in der Ausgabe für ein Regressionsmodell auch die Restdiagramme, um zu überprüfen, ob parametrische Annahmen gelten.