Winterの方法のすべての統計量およびグラフを解釈する

Winterの方法によって得られるすべての統計量およびグラフの定義と解釈について解説します。

長さ

時系列に含まれる観測値の数。

α(水準)

αは、平滑推定値の水準成分で使用される重み値です。αは、観測値の移動平均に似ています。重み値により、現在の条件に対する各成分の反応を定義して平滑化の量を調整します。重み値を小さくすると、最近のデータに対する比重が小さくなります。重み値を大きくすると、最近のデータに対する比重が大きくなります。通常は、水準成分の重み値を調整することが、精度の測度を改善する最適な方法です。通常、その他の重み値を変更しても、水準の重みを適切な値に調整した後の効果は小さくなります。

γ(トレンド)

γは、平滑化推定値のトレンド成分で使用される重み値です。γは、連続する観測値間の階差の移動平均に似ています。この重み値により、現在の条件に対する各成分の反応を定義して平滑化の量を調整します。

重み値を大きくすると、最近のデータに対する影響力が大きくなり、予測値(緑)はデータ(黒)の終わりに下向きのトレンドに従うようになります。

トレンドの重み値が大きい場合

重み値を小さくすると、最近のデータに対する影響力が小さくなり、予測値は全体的に上向きのトレンドに従うようになります。

トレンドの重み値が小さい場合

δ(季節)

δは平滑化推定値の季節成分で使用される重み値です。この重み値により、現在の条件に対する各成分の反応を定義して平滑化の量を調整します。重み値を小さくすると最近のデータに対する比重が小さくなります。重み値を大きくすると、最近のデータに対する比重が大きくなります。

MAPE

平均絶対パーセント誤差(MAPE)では、精度を誤差のパーセント値として表します。MAPEはパーセント値であるため、他の測度統計量よりも容易に理解できます。たとえば、MAPEが5の場合、予測値は平均で5%外れます。

ただし、データに対するモデルの適合度が高いように見える場合でも、MAPEの値が非常に大きくなることがあります。プロットを調べ、いずれかのデータ値が0に近いかどうか確認します。MAPEでは絶対誤差を実際のデータで除算するため、値が0に近いとMAPEの値が非常に大きくなります。

解釈

異なる時系列モデルの適合度を比較するために使用します。値が小さいほど適合性が高いことを示します。単一のモデルに、3つすべての精度の測度の最低値が含まれていない場合、通常はMAPEが優先される測定方法となります。

精度の測度は、1期間先の残差に基づいています。各時点でこのモデルを使用して、時系列における次の期間のY値を予測します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりから始まる1期間を予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べて、特に系列の終わりにおいてその予測とモデルがデータに密接に従うことを確認する必要があります。

MAD

平均絶対偏差(MAD)により、データと同じ単位で精度を表現し、誤差の量を概念化することができます。外れ値の影響は、MSDの場合よりMADの場合のほうが小さくなります。

解釈

異なる時系列モデルの適合度を比較する目的で使用します。値が小さいほど適合性が高いことを示します。

精度の測度は、1期間先の残差に基づいています。このモデルは、各時点において、時系列の次の期間におけるY値を予測する目的で使用します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりから始まる1期間について予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べ、特に系列の終わりに、その予測値とモデルがデータに密接に従うことを確認する必要があります。

MSD

平均平方偏差(MSD)により、当てはめられた時系列の値の精度を測定します。外れ値の影響は、MADの場合よりMSDの場合のほうが大きくなります。

解釈

異なる時系列モデルの適合度を比較する目的で使用します。値が小さいほど適合性が高いことを示します。

精度の測度は、1期間先の残差に基づいています。このモデルは、各時点において、時系列の次の期間におけるY値を予測する目的で使用します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりからの1期間を予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べて、特に系列の終わりにその予測とモデルがデータに密接に従うことを確認する必要があります。

平滑化

平滑データは、水準成分と季節成分の和(加法的モデル)か、または水準成分と季節成分の積(乗法的モデル)のいずれかです。

予測

予測値は適合値とも呼ばれます。予測値は、時間(t)における変数の点推定です。

観測値からの差が非常に大きな予測値を含む観測値は、異常な観測値か、または影響力のある観測値である可能性があります。外れ値がある場合は原因の特定を試みてください。データ入力誤差や測定誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。

誤差

誤差値は残差とも呼ばれます。誤差値は、観測値と予測値の差です。

解釈

誤差値をプロットして、モデルが適合するかどうかを判断します。誤差値は、データに対するモデルの適合度を示す有効な情報です。一般に、誤差値は0付近にランダムに分布し、明確なパターンや異常値を示しません。

期間

Minitabには、予測を行う期間が表示されます。期間は、予測の時間単位です。予測は、デフォルトでデータの終わりに開始されます。

予測

予測値は、時系列モデルから得られる適合値です。Minitabには、指定する予測の数が表示されます。予測は、データの終わりか、指定する原点で開始されます。

解釈

予測を使用して、指定した期間における変動を予測します。たとえば倉庫管理者は、過去60か月間の注文状況に基づいて、向こう3か月間の製品の発注量をモデル化することができます。

プロットでの適合値と予測値を調べて、正確な予測になるかどうか判断します。適合値は、特に系列の終わりにデータに密接に従います。季節モデルを使用する場合は、時系列の終わりに適合値が実際の値と一致することを検証することが特に重要です。季節パターンまたはトレンドが、データの終わりに適合値と調和しない場合は、予測の精度が低い可能性があります。この場合は、さらにデータを収集して、モデルが季節パターンまたはトレンドにおける変化に適応できるようにしてください。

モデルが系列の終わりにデータに適合する場合は、通常、少なくとも1シーズンの季節サイクルを安全に予測できます。

下側と上側

下側予測限界と上側予測限界により、各予測の予測区間を設定します。予測区間とは、予測値が含まれる可能性がある範囲です。たとえば、予測区間が95%の場合は、指定した時間における予測値が予測区間に含まれると、95%の信頼度で確信できます。

Winterの方法のプロット

このプロットには、観測値と時間の関係が表示されます。このプロットには、平滑化の方法から計算される適合値、予測値、平滑化定数、および精度の測度が含まれます。適合値の代わりに平滑化値を表示する設定を選択することもできます。

解釈

プロットを調べて、モデルがデータに適合するかどうか判断します。適合が実際のデータに密接に従う場合、モデルはデータに適合します。
  • モデルがデータに適合する場合は、分解を実行し、2つのモデルを比較できます。
  • モデルがデータに適合しない場合は、プロットに季節性が欠けていないか調べます。季節パターンが存在しない場合は、別の時系列分析を使用してください。詳細は、使用する時系列分析を参照してください。

このプロットでは適合値がデータに密接に従っており、これは、そのモデルがデータに適合することを示しています。

残差のヒストグラム

残差のヒストグラムには、すべての観測値の残差の分布が表示されます。モデルがデータによく適合する場合は、平均が0のランダム分布になります。したがって、ヒストグラムは、0を中心とするほぼ対称な形になります。

残差の正規確率プロット

残差の正規プロットには、分布が正規分布する場合の残差と期待値の関係が表示されます。

解釈

残差の正規プロットを使用して、残差が正規分布かどうかを判断します。ただし、この分析には、正規分布した残差は不要です。

残差が正規分布の場合、残差の正規の確率プロットは直線に近似します。次のパターンは、残差が正規分布していないことを示唆しています。

S曲線は、長い裾を持つ分布を示唆しています。

逆S曲線は、短い裾を持つ分布を示唆しています。

下向きの曲線は、右方向の歪みを示唆しています。

少数の点が直線から離れている場合は、外れ値のある分布を示唆しています。

残差対適合値

残差対適合値プロットでは、y軸に残差が、x軸に適合値が表示されます。

解釈

残差対適合値プロットを使用して、残差に偏りがなく、均一分散かどうかを判断します。理想的なのは、各点が0の両側にランダムにプロットされ、認識可能なパターンが存在しない状態です。

次の表のパターンは、残差が偏っており、不均一分散であることを示す可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値

残差に不均一分散またはパターンがある場合、予測は正確ではない可能性があります。

残差対データ順序

残差対データ順序プロットには、データの収集順に残差が表示されます。

解釈

残差対データ順序プロットを使用して、観測期間に観測された値と比較した適合値の正確さを確認します。各点におけるパターンは、モデルがデータに適合しないことを示す可能性があります。理想的には、プロットの残差が中心線の周囲にランダムにプロットされます。

次のパターンは、モデルがデータに適合しないことを示す可能性があります。
パターン パターンが示す意味
一貫した長期トレンド モデルはデータに適合しない
短期トレンド パターンにおけるシフトまたは変化
その他の点から遠い点 外れ値
点での突然のシフト データの基本的なパターンが変更された
以下は、モデルがデータに適合しないことを示す可能性があるパターンの例です。

残差は、観測値の順序が左から右に向かって増加するにつれて体系的に減少します。

残差の値が低(左)から高(右)に急激に変化しています。

残差対変数

残差対変数プロットには、別の変数に対する残差の値が表示されます。

解釈

このプロットを使用して、変数が系統的に応答に影響するかどうかを判断します。残差にパターンがある場合、その他の変数が応答に関連付けられます。この情報は、追加調査の基本として参考にすることができます。