Methoden und Formeln für Box-Cox Transformation für Zeitreihen

Box-Cox-Transformation

Die Box-Cox-Transformation wird durch die folgende Formel ausgedrückt:

Hierbei ist Xi ein ursprünglicher Datenwert und λ der Parameter für die Transformation. Wenn die Analyse nach dem optimalen Wert von λsucht, rundet die Analyse den optimalen Wert von λ auf 0,5 oder auf die nächste ganze Zahl, um die Transformation durchzuführen.

Gängige λ-Werte

Die folgende Tabelle zeigt einige gängige λ-Werte und deren Transformationen.
λ Transformation
2
0.5
0
-1

Suche nach dem optimalen λ

Minitab Statistical Software verwendet die Methode von Guerrero1 um das Kriterium für den optimalen Wert von λ und die Methode von Brent2, um nach dem optimalen Wert zu suchen. Der Analyse umfasst die folgenden allgemeinen Schritte:
  1. Definieren Sie das Kriterium für den optimalen Wert als minimalen Variationskoeffizienten.
  2. Teilen Sie die Reihe in H-Unterreihen auf.
  3. Verwenden Sie die Methode von Brent, um den Wert von λ zu finden, der den Variationskoeffizienten minimiert.

In den folgenden Abschnitten werden die Teilreihen und der Variationskoeffizient definiert.

Unterreihen

Unterteilen Sie die Reihe in Unterreihen nach Saisonzeitraum. Wenn sich der Jahreszeitraum nicht gleichmäßig in die Reihe aufteilt, lassen Sie die verbleibenden Beobachtungen vom Anfang der Reihe weg. Wenn die Spezifikationen für die Analyse keinen saisonalen Zeitraum enthalten, setzen Sie den Jahreszeitraum = 2.

Nehmen wir beispielsweise eine ursprüngliche Zeitreihe mit 10 Beobachtungen und einem saisonalen Zeitraum von 4 an: {5, 6, 3, 2, 9, 8, 1, 7, 10, 4}. Die Anzahl der Unterreihen beträgt 10 modulo 4 = 2. Da 4 nicht gleichmäßig in 10 unterteilt ist, verwenden Sie nur die letzten 8 Beobachtungen, um die Unterreihe zu bilden. Die Unterreihen sind {3, 2, 9, 8} und {1, 7, 10, 4}.

Fehlende Werte

Wenn eine Unterreihe 1 oder mehr fehlende Werte enthält, lassen Sie die Unterreihe bei der Suche nach dem optimalen Wert von λ aus den Berechnungen aus. Die Suche erfordert mindestens 2 Unterreihen ohne fehlende Werte.

Variationskoeffizient

Verwenden Sie die folgenden Definitionen, um den Variationskoeffizienten zu berechnen:
BegriffBeschreibung
X1, X2, … XNdie Beobachtungen in der ursprünglichen Zeitreihe
PDer Jahreszeitraum der ursprünglichen Zeitreihe
Xh, iDie i-ten Beobachtung in der Unterreihe h, wobei i=1, ..., P und h=1, ..., H
das Stichprobenmittel der h-ten Unterreihe
die Stichprobenstandardabweichung der h-ten Unterreihe

Die folgenden Gleichungen definieren die Statistiken für jede Teilreihe:

Für ein gegebenes λ und für h=1, ..., H verwendet folgende Definition:

Berechnen Sie den Stichprobendurchschnitt und die Stichprobenstandardabweichung für die W-Statistik :

Der Variationskoeffizient (CV) für die W-Statistik hat die folgende Gleichung:

Verwenden Sie die Methode von Brent, um den Wert von λ zu finden, der den CV im Intervall von den Spezifikationen für die Analyse minimiert. Die Analyse rundet den optimalen Wert von λ auf 0,5 oder auf die nächste ganze Zahl, um die Transformation durchzuführen.

1 Guerrero, V.M. (1993). Time series analysis supported by power transformation. Journal of Forecasting 12(1), 37-48.
2 Brent, R. P. (1973) An algorithm with guaranteed convergence for finding a minimum of a function of one variable. zu definieren Im Algorithms for minimization without derivatives (pp. 61-80). Prentice Hall.