Wählen Sie die Optionen für Regressionsmodell anpassen und Lineare Regression

Statistik > Regression > Regression > Regressionsmodell anpassen > Optionen

Predictive Analytics-Modul > Lineare Regression > Optionen

Gewichtungen

Geben Sie im Feld Gewichtungen eine numerische Spalte mit Gewichtungen ein, um eine gewichtete Regression durchzuführen. Die gewichtete Regression ist eine Methode, die verwendet werden kann, wenn die für die kleinsten Quadrate getroffene Annahme einer konstanten Varianz in den Residuen verletzt wird (auch als Heteroskedastizität bezeichnet). Bei der richtigen Gewichtung minimiert dieses Verfahren die Summe der gewichteten quadrierten Residuen, um Residuen mit einer konstanten Varianz zu erzielen (auch als Homoskedastizität bezeichnet). Weitere Informationen zum Ermitteln der geeigneten Gewichtung finden Sie unter Gewichtete Regression.

Die Gewichtungen müssen größer oder gleich null sein. Die Spalte mit den Gewichtungen muss dieselbe Anzahl von Zeilen wie die Spalte mit der Antwortvariablen aufweisen.

Konfidenzniveau für alle Intervalle

Geben Sie das Konfidenzniveau für die Konfidenzintervalle für die Koeffizienten und die angepassten Werte ein.

In der Regel ist ein Konfidenzniveau von 95 % gut geeignet. Ein 95%-Konfidenzniveau gibt an, dass bei einer Entnahme von 100 Zufallsstichproben aus der Grundgesamtheit die Konfidenzintervalle für ungefähr 95 der Stichproben den Mittelwert der Antwortvariablen enthalten. Für einen bestimmten Datensatz erzeugt ein niedrigeres Konfidenzniveau ein schmaleres Intervall, während mit einem höheren Konfidenzniveau ein breiteres Intervall erzielt wird.

Hinweis

Um die Konfidenzintervalle anzuzeigen, öffnen Sie das Unterdialogfeld Ergebnisse, und wählen Sie im Feld Darstellung der Ergebnisse die Option Erweiterte Tabellen aus.

Typ des Konfidenzintervalls

Sie können ein beidseitiges Intervall oder eine einseitige Grenze auswählen. Bei demselben Konfidenzniveau liegt eine Grenze näher an der Punktschätzung als das Intervall. Die Obergrenze liefert keinen wahrscheinlichen unteren Wert. Die Untergrenze liefert keinen wahrscheinlichen oberen Wert.

Die prognostizierte mittlere Konzentration von gelösten Feststoffen in Wasser beträgt beispielsweise 13,2 mg/l. Das 95%-Konfidenzintervall für den Mittelwert von mehreren zukünftigen Beobachtungen erstreckt sich von 12,8 mg/l bis 13,6 mg/l. Die 95%-Obergrenze für den Mittelwert mehrerer zukünftiger Beobachtungen beträgt 13,5 mg/l; dies ist präziser, da die Grenze näher am prognostizierten Mittelwert liegt.
Beidseitig
Verwenden Sie ein beidseitiges Konfidenzintervall, um eine wahrscheinliche Untergrenze und eine wahrscheinliche Obergrenze für den Mittelwert der Antwortvariablen zu schätzen.
Untergrenze
Verwenden Sie eine untere Konfidenzgrenze, um eine wahrscheinliche Untergrenze für den Mittelwert der Antwortvariablen zu schätzen.
Obergrenze
Verwenden Sie eine obere Konfidenzgrenze, um eine wahrscheinliche Obergrenze für den Mittelwert der Antwortvariablen zu schätzen.

Summe der Quadrate für Tests

Wählen Sie die Summe der Quadrate (SS) aus, die beim Berechnen des F-Werts und der p-Werte verwendet werden soll. Am häufigsten wird die korrigierte Summe der Quadrate verwendet. Verwenden Sie die sequenzielle Summe der Quadrate, um die Signifikanz der Terme entsprechend der Reihenfolge zu ermitteln, in der sie in das Modell aufgenommen wurden.
Summe der Quadrate für Tests
  • Korrigiert (Typ III): Stellt die Abnahme der Summe der quadrierten Fehler dar, wenn der Term einem Modell hinzugefügt wird, das alle übrigen Terme enthält.
  • Sequenziell (Typ I): Stellt die Abnahme der Summe der quadrierten Fehler dar, wenn ein Term einem Modell hinzugefügt wird, das lediglich die ihm vorausgehenden Terme enthält.

Box-Cox-Transformation

Führen Sie eine Box-Cox-Transformation für die Daten der Antwortvariablen durch, wenn die Residuen nicht normalverteilt sind oder keine konstante Varianz aufweisen. Wenn Sie Ihre Daten transformieren, transformiert Minitab die Daten der Antwortvariablen und verwendet sie für die Analyse. Unter den meisten Bedingungen ist es nicht notwendig, die Nicht-Normalverteilung zu korrigieren, außer die Daten sind übermäßig schief. Wenn Sie eine Box-Cox-Transformation verwenden, müssen alle Daten der Antwortvariablen positiv (>0) sein. Um festzustellen, ob die Box-Cox-Transformation für Ihre Daten geeignet ist, untersuchen Sie die Residuendiagramme und andere Bewertungsmaße. Weitere Informationen zum Prüfen des Modells finden Sie unter Validieren von Modellannahmen in der Regression oder ANOVA.
Box-Cox-Transformation
Wählen Sie den Lambda-Wert aus, mit dem Minitab die Daten transformieren soll:
  • Keine Transformation: Es werden die ursprünglichen Daten der Antwortvariablen verwendet.
  • Optimales λ: Es wird der optimale Lambda-Wert verwendet, der die am besten geeignete Transformation ergeben sollte. In der Standardeinstellung rundet Minitab den optimalen Lambda-Wert auf 0,5 oder die nächste ganze Zahl. Minitab rundet beispielsweise den Lambda-Wert auf –1; –0,5; 0; 0,5; 1 usw. Wenn Sie anstelle des gerundeten Werts den optimalen Wert für die Transformation verwenden möchten, wählen Sie Datei > Optionen > Lineare Modelle > Darstellung der Ergebnisse aus.
  • λ = 0 (natürlicher Logarithmus): Der natürliche Logarithmus der Daten wird verwendet.
  • λ = 0,5 (Quadratwurzel): Die Quadratwurzel der Daten wird verwendet.
  • λ: Es wird ein angegebener Wert für Lambda verwendet. Weitere gängige Transformationen sind die Quadrattransformation (λ = 2), die Transformation mit der inversen Quadratwurzel (λ = −0,5) und die inverse Transformation (λ = −1). Im Allgemeinen sollte kein Wert außerhalb des Bereichs von −2 bis 2 verwendet werden.