二重指数平滑化のすべての統計量およびグラフを解釈する

二重指数平滑化によって得られるすべての統計量とグラフの定義と解釈について解説します。

長さ

時系列に含まれる観測値の数。

α(水準)

αは、平滑推定値の水準成分で使用される重み値です。αは、観測値の移動平均に似ています。重み値により、現在の条件に対する各成分の反応を定義して平滑化の量を調整します。重み値を小さくすると、最近のデータに対する比重が小さくなります。重み値を大きくすると、最近のデータに対する比重が大きくなります。通常は、水準成分の重み値を調整することが、精度の測度を改善する最適な方法です。通常、その他の重み値を変更しても、水準の重みを適切な値に調整した後の効果は小さくなります。

γ(トレンド)

γは、平滑推定値のトレンド成分で使用される重み値です。γは、連続する観測値間の差の移動平均に似ています。重み値により、現在の条件に対する各成分の反応を定義して平滑化の量を調整します。

重み値を小さくすると、最近のデータに対する比重が小さくなり、予測値(緑)は全体的なトレンドに従うようになります。

トレンド = 0.03

重み値を大きくすると、最近のデータに対する比重が大きくなり、予測値はデータの終わりにトレンドに従うようになります。

トレンド = 0.80

MAPE

平均絶対パーセント誤差(MAPE)では、精度を誤差のパーセント値として表します。MAPEはパーセント値であるため、他の測度統計量よりも容易に理解できます。たとえば、MAPEが5の場合、予測値は平均で5%外れます。

ただし、データに対するモデルの適合度が高いように見える場合でも、MAPEの値が非常に大きくなることがあります。プロットを調べ、いずれかのデータ値が0に近いかどうか確認します。MAPEでは絶対誤差を実際のデータで除算するため、値が0に近いとMAPEの値が非常に大きくなります。

解釈

異なる時系列モデルの適合度を比較するために使用します。値が小さいほど適合性が高いことを示します。単一のモデルに、3つすべての精度の測度の最低値が含まれていない場合、通常はMAPEが優先される測定方法となります。

精度の測度は、1期間先の残差に基づいています。各時点でこのモデルを使用して、時系列における次の期間のY値を予測します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりから始まる1期間を予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べて、特に系列の終わりにおいてその予測とモデルがデータに密接に従うことを確認する必要があります。

MAD

平均絶対偏差(MAD)により、データと同じ単位で精度を表現し、誤差の量を概念化することができます。外れ値の影響は、MSDの場合よりMADの場合のほうが小さくなります。

解釈

異なる時系列モデルの適合度を比較する目的で使用します。値が小さいほど適合性が高いことを示します。

精度の測度は、1期間先の残差に基づいています。このモデルは、各時点において、時系列の次の期間におけるY値を予測する目的で使用します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりから始まる1期間について予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べ、特に系列の終わりに、その予測値とモデルがデータに密接に従うことを確認する必要があります。

MSD

平均平方偏差(MSD)により、当てはめられた時系列の値の精度を測定します。外れ値の影響は、MADの場合よりMSDの場合のほうが大きくなります。

解釈

異なる時系列モデルの適合度を比較する目的で使用します。値が小さいほど適合性が高いことを示します。

精度の測度は、1期間先の残差に基づいています。このモデルは、各時点において、時系列の次の期間におけるY値を予測する目的で使用します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりからの1期間を予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べて、特に系列の終わりにその予測とモデルがデータに密接に従うことを確認する必要があります。

平滑化

平滑化データは、時系列モデルの水準成分です。

予測

予測値は適合値とも呼ばれます。予測値は、時間(t)における変数の点推定です。

観測値からの差が非常に大きな予測値を含む観測値は、異常な観測値か、または影響力のある観測値である可能性があります。外れ値がある場合は原因の特定を試みてください。データ入力誤差や測定誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。

誤差

誤差値は残差とも呼ばれます。誤差値は、観測値と予測値の差です。

解釈

誤差値をプロットして、モデルが適合するかどうかを判断します。誤差値は、データに対するモデルの適合度を示す有効な情報です。一般に、誤差値は0付近にランダムに分布し、明確なパターンや異常値を示しません。

期間

Minitabには、予測を行う期間が表示されます。期間は、予測の時間単位です。予測は、デフォルトでデータの終わりに開始されます。

予測

予測値は、時系列モデルから得られる適合値です。Minitabには、指定する予測の数が表示されます。予測は、データの終わりか、指定する原点で開始されます。

解釈

予測を使用して、指定した期間における変動を予測します。たとえば倉庫管理者は、過去60か月間の注文状況に基づいて、向こう3か月間の製品の発注量をモデル化することができます。

プロットでの適合値と予測値を調べて、正確な予測になるかどうか判断します。適合値は、特に系列の終わりにデータに密接に従います。系列の終わりにデータからずれる場合、または予測のトレンド線がデータの一般的なフローと一致しない場合は、基本のトレンドが変化に合わせてまだ調整され続けている可能性があります。データをさらに収集して、基本のトレンドにおける変化が短期的なものなのか、または長期的なものなのかを判断してください。

予測が正確なものに見える場合でも、ずっと先の将来の予測は慎重に行ってください。通常は、6期間先までの範囲についてのみ予測してください。

下側と上側

下側予測限界と上側予測限界により、各予測の予測区間を設定します。予測区間とは、予測値が含まれる可能性がある範囲です。たとえば、予測区間が95%の場合は、指定した時間における予測値が予測区間に含まれると、95%の信頼度で確信できます。

平滑化プロット

平滑化プロットには、観測値と時間の関係が表示されます。このプロットには、平滑化の方法から計算される適合値、予測値、平滑化定数、および精度の測度が含まれます。適合値の代わりに平滑化値を表示する設定を選択することもできます。

解釈

平滑化プロットを調べて、モデルがデータに適合するかどうか判断します。適合値が実際のデータに密接に従う場合、モデルはデータに適合します。必ず、トレンドの方向または強度が変わる転換点すべてを調べてください。
  • モデルがデータに適合する場合は、トレンド分析を実行し、2つのモデルを比較できます。
  • モデルがデータに適合しない場合は、季節性があるかどうか、またはトレンドがないかどうかプロットを調べます。季節性があること、またはトレンドがないことの証拠が認められる場合は、別の時系列分析を使用してください。詳細は、使用する時系列分析を参照してください。

この平滑化プロットでは適合値がデータに密接に従っており、これは、そのモデルがデータに適合することを示しています。

残差のヒストグラム

残差のヒストグラムには、すべての観測値の残差の分布が表示されます。モデルがデータによく適合する場合は、平均が0のランダム分布になります。したがって、ヒストグラムは、0を中心とするほぼ対称な形になります。

残差の正規確率プロット

残差の正規プロットには、分布が正規分布する場合の残差と期待値の関係が表示されます。

解釈

残差の正規プロットを使用して、残差が正規分布かどうかを判断します。ただし、この分析には、正規分布した残差は不要です。

残差が正規分布の場合、残差の正規の確率プロットは直線に近似します。次のパターンは、残差が正規分布していないことを示唆しています。

S曲線は、長い裾を持つ分布を示唆しています。

逆S曲線は、短い裾を持つ分布を示唆しています。

下向きの曲線は、右方向の歪みを示唆しています。

少数の点が直線から離れている場合は、外れ値のある分布を示唆しています。

残差対適合値

残差対適合値プロットでは、y軸に残差が、x軸に適合値が表示されます。

解釈

残差対適合値プロットを使用して、残差に偏りがなく、均一分散かどうかを判断します。理想的なのは、各点が0の両側にランダムにプロットされ、認識可能なパターンが存在しない状態です。

次の表のパターンは、残差が偏っており、不均一分散であることを示す可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値

残差に不均一分散またはパターンがある場合、予測は正確ではない可能性があります。

残差対データ順序

残差対データ順序プロットには、データの収集順に残差が表示されます。

解釈

残差対データ順序プロットを使用して、観測期間に観測された値と比較した適合値の正確さを確認します。各点におけるパターンは、モデルがデータに適合しないことを示す可能性があります。理想的には、プロットの残差が中心線の周囲にランダムにプロットされます。

次のパターンは、モデルがデータに適合しないことを示す可能性があります。
パターン パターンが示す意味
一貫した長期トレンド モデルはデータに適合しない
短期トレンド パターンにおけるシフトまたは変化
その他の点から遠い点 外れ値
点での突然のシフト データの基本的なパターンが変更された
以下は、モデルがデータに適合しないことを示す可能性があるパターンの例です。

残差は、観測値の順序が左から右に向かって増加するにつれて体系的に減少します。

残差の値が低(左)から高(右)に急激に変化しています。

残差対変数

残差対変数プロットには、別の変数に対する残差の値が表示されます。

解釈

このプロットを使用して、変数が系統的に応答に影響するかどうかを判断します。残差にパターンがある場合、その他の変数が応答に関連付けられます。この情報は、追加調査の基本として参考にすることができます。

本サイトを使用すると、分析およびコンテンツのカスタマイズのためにクッキーが使用されることに同意したことになります。  当社のプライバシーポリシーをご確認ください