Ljung-Box q(LBQ)統計量とは

Ljung-Box q統計量を使用して、経過時間内における一連の観測値がランダムで独立しているかどうかを検定します。観測値が独立していない場合は、1つの観測値がk時間単位後の別の観測値と相関している可能性があり、この関係を自己相関といいます。自己相関があると、時系列プロットなどの時間に基づいた予測モデルの精度が低下し、データが誤って解釈される可能性があります。

たとえば、ある電子機器会社が毎月の電池の売上を5年間調べるとします。会社では、そのデータを使用して時系列モデルを作成し、将来の売上を予測できるようにしたいと考えています。しかし、毎月の売上は季節的なトレンドの影響を受けているかもしれません。たとえば、人々がクリスマスのおもちゃ用に電池を買う時期になると、売上が毎年上昇します。したがって、1年間の毎月の売上観測値は、12か月後(Lag = 12)の毎月の売上観測値と相関する可能性があります。

時系列モデルを選択する前に、毎月の売上の差どうしの自己相関を評価することができます。Ljung-Box Q(LBQ)統計量により、遅れk = 0になるまでは自己相関する(つまり、遅れが特定の数(この場合は12)になるまで、データ値はランダムで独立している)という帰無仮説を検定します。LBQが指定された棄却値より大きい場合は、1つ以上の遅れの自己相関がゼロと有意に異なり、経過時間中の値はランダムでも独立してもいないことを示す可能性があります。

LBQは、ARIMAなどの時系列モデルを当てはめた後に仮定を評価して、残差が独立していることを確認する場合にも使用されます。

Ljung-Boxはかばん検定であり、Box-Pierceカイ二乗統計の修正版です。