Bei der Regression der besten Teilmengen verwendet Minitab ein Verfahren namens Hamiltonpfad (auch als Hamiltonkreis bezeichnet), bei dem es sich um eine Methode zur Berechnung aller möglichen Teilmengen von Prädiktoren (jeweils eine Teilmenge pro Schritt) handelt. Das heißt, Minitab berechnet alle 2**m–1 Teilmengen in 2**m–1 Schritten, wobei m die Anzahl der Prädiktoren im Modell ist. Minitab wertet in jedem Schritt eine andere Teilmengenregression aus.
Jede Teilmenge im Hamiltonpfad unterscheidet sich von der vorangegangenen Teilmenge durch Hinzufügen oder Entfernen von genau einer Variablen. Der Sweep-Operator fügt mit jedem Schritt des Hamiltonianpfads eine Variable zur Regression hinzu bzw. entfernt sie daraus und berechnet für jede Teilmenge R2.
Für ein Modell mit mehreren Prädiktoren lautet die Gleichung:
y = β0 + β1x1 + … + βkxk + ε
Die angepasste Gleichung lautet:
Bei der einfachen linearen Regression, die nur einen Prädiktor enthält, lautet das Modell:
y=ß0+ ß1x1+ε
Bei Verwendung der Regressionsschätzwerte b0 für ß0 und b1 für ß1 lautet die angepasste Gleichung:
Begriff | Beschreibung |
---|---|
y | Antwortvariable |
xk | k-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein. |
ßk | k-ter Regressionskoeffizient der Grundgesamtheit |
ε | Fehlerterm, der einer Normalverteilung mit dem Mittelwert 0 folgt |
bk | Schätzwert des k-ten Regressionskoeffizienten der Grundgesamtheit |
![]() | angepasste Antwortvariable |
R2 wird auch als Determinationskoeffizient bezeichnet.
Begriff | Beschreibung |
---|---|
yi | i-ter beobachteter Wert der Antwortvariablen |
![]() | Mittelwert der Antwortvariablen |
![]() | i-ter angepasster Wert der Antwortvariablen |
Begriff | Beschreibung |
---|---|
MS | Mittel der Quadrate |
SS | Summe der Quadrate |
DF | Freiheitsgrade |
Begriff | Beschreibung |
---|---|
n | Anzahl der Beobachtungen |
ei | i-tes Residuum |
hi | i-tes Diagonalelement von X (X' X)-1X' |
Obwohl die Berechnungen für R2 (prog) negative Werte ergeben können, zeigt Minitab in derartigen Fällen null an.
Begriff | Beschreibung |
---|---|
yi | i-ter beobachteter Wert der Antwortvariablen |
![]() | Mittelwert der Antwortvariablen |
n | Anzahl der Beobachtungen |
ei | i-tes Residuum |
hi | i-tes Diagonalelement von X(X'X)–1X' |
X | Designmatrix |
Begriff | Beschreibung |
---|---|
SSEp | Summe der quadrierten Fehler für das untersuchte Modell |
MSEm | mittleres Fehlerquadrat für das Modell mit allen potenziellen Termen |
n | Anzahl der Beobachtungen |
p | Anzahl der Terme im Modell, einschließlich der Konstanten |
Begriff | Beschreibung |
---|---|
MSE | Mittleres Fehlerquadrat |
Beobachtungen mit einer Gewichtung von 0 sind in der Analyse nicht enthalten.
Begriff | Beschreibung |
---|---|
n | Anzahl der Beobachtungen |
R | Summe der Quadrate für Fehler für das Modell |
wi | Gewichtung für die i-te Beobachtung |
Das AICc wird nicht berechnet, wenn .
Begriff | Beschreibung |
---|---|
n | Anzahl der Beobachtungen |
p | Anzahl der Koeffizienten im Modell einschließlich der Konstante |
Begriff | Beschreibung |
---|---|
p | Anzahl der Koeffizienten im Modell einschließlich der Konstante |
n | Anzahl der Beobachtungen |
Begriff | Beschreibung |
---|---|
C | Bedingungszahl |
λMaximum | maximaler Eigenwert aus der Korrelationsmatrix der Terme im Modell, ausschließlich des Schnittpunkts |
λMinimum | minimaler Eigenwert aus der Korrelationsmatrix der Terme im Modell, ausschließlich des Schnittpunkts |