Methoden und Formeln für Regression der besten Teilmengen

In diesem Thema

Berechnungsverfahren
Regressionsgleichung
R-Qd
R-Qd(kor)
PRESS
R-Qd (prog)
Mallows-Cp
S
Log-Likelihood
Akaikes korrigiertes Informationskriterium (AICc)
Bayessches Informationskriterium (BIC)
Bedingungszahl

Berechnungsverfahren

Bei der Regression der besten Teilmengen verwendet Minitab ein Verfahren namens Hamiltonpfad (auch als Hamiltonkreis bezeichnet), bei dem es sich um eine Methode zur Berechnung aller möglichen Teilmengen von Prädiktoren (jeweils eine Teilmenge pro Schritt) handelt. Das heißt, Minitab berechnet alle 2**m–1 Teilmengen in 2**m–1 Schritten, wobei m die Anzahl der Prädiktoren im Modell ist. Minitab wertet in jedem Schritt eine andere Teilmengenregression aus.

Jede Teilmenge im Hamiltonpfad unterscheidet sich von der vorangegangenen Teilmenge durch Hinzufügen oder Entfernen von genau einer Variablen. Der Sweep-Operator fügt mit jedem Schritt des Hamiltonianpfads eine Variable zur Regression hinzu bzw. entfernt sie daraus und berechnet für jede Teilmenge R².

Regressionsgleichung

Für ein Modell mit mehreren Prädiktoren lautet die Gleichung:

y = β₀ + β₁x₁ + … + β_kx_k + ε

Die angepasste Gleichung lautet:

Bei der einfachen linearen Regression, die nur einen Prädiktor enthält, lautet das Modell:

y=ß₀+ ß₁x₁+ε

Bei Verwendung der Regressionsschätzwerte b₀ für ß₀ und b₁ für ß₁ lautet die angepasste Gleichung:

Notation

Begriff	Beschreibung
y	Antwortvariable
x_k	k-ter Term. Jeder Term kann ein einzelner Prädiktor, ein Polynomialterm oder ein Wechselwirkungsterm sein.
ß_k	k-ter Regressionskoeffizient der Grundgesamtheit
ε	Fehlerterm, der einer Normalverteilung mit dem Mittelwert 0 folgt
b_k	Schätzwert des k-ten Regressionskoeffizienten der Grundgesamtheit
	angepasste Antwortvariable

R-Qd

R² wird auch als Determinationskoeffizient bezeichnet.

Formel

Notation

Begriff	Beschreibung
y_i	i-ter beobachteter Wert der Antwortvariablen
	Mittelwert der Antwortvariablen
	i-ter angepasster Wert der Antwortvariablen

R-Qd(kor)

Notation

Begriff	Beschreibung
MS	Mittel der Quadrate
SS	Summe der Quadrate
DF	Freiheitsgrade

PRESS

Bewertet die Prognosefähigkeiten des Modells und wird wie folgt berechnet:

Notation

Begriff

Beschreibung

Anzahl der Beobachtungen

e_i

i-tes Residuum

h_i

i-tes Diagonalelement von

X (X' X)^-1X'

R-Qd (prog)

Obwohl die Berechnungen für R² (prog) negative Werte ergeben können, zeigt Minitab in derartigen Fällen null an.

Notation

Begriff	Beschreibung
y_i	i-ter beobachteter Wert der Antwortvariablen
	Mittelwert der Antwortvariablen
n	Anzahl der Beobachtungen
e_i	i-tes Residuum
h_i	i-tes Diagonalelement von X(X'X)^–1X'
X	Designmatrix

Mallows-Cp

Notation

Begriff	Beschreibung
SSE_p	Summe der quadrierten Fehler für das untersuchte Modell
MSE_m	mittleres Fehlerquadrat für das Modell mit allen potenziellen Termen
n	Anzahl der Beobachtungen
p	Anzahl der Terme im Modell, einschließlich der Konstanten

S

Notation

Begriff	Beschreibung
MSE	Mittleres Fehlerquadrat

Log-Likelihood

Minitab verwendet für nicht gewichtete Analysen folgende Gleichung:

Für Analysen, bei denen die Beobachtungen gewichtet werden, verwendet Minitab die folgende Gleichung:

Beobachtungen mit einer Gewichtung von 0 sind in der Analyse nicht enthalten.

Notation

Begriff	Beschreibung
n	Anzahl der Beobachtungen
R	Summe der Quadrate für Fehler für das Modell
w_i	Gewichtung für die i-te Beobachtung

Akaikes korrigiertes Informationskriterium (AICc)

Das AICc wird nicht berechnet, wenn .

Notation

Begriff	Beschreibung
n	Anzahl der Beobachtungen
p	Anzahl der Koeffizienten im Modell einschließlich der Konstante

Bayessches Informationskriterium (BIC)

Notation

Begriff	Beschreibung
p	Anzahl der Koeffizienten im Modell einschließlich der Konstante
n	Anzahl der Beobachtungen

Bedingungszahl

Notation

Begriff	Beschreibung
C	Bedingungszahl
λ_Maximum	maximaler Eigenwert aus der Korrelationsmatrix der Terme im Modell, ausschließlich des Schnittpunkts
λ_Minimum	minimaler Eigenwert aus der Korrelationsmatrix der Terme im Modell, ausschließlich des Schnittpunkts