移動平均のすべての統計量およびグラフを解釈する

移動平均によって得られるすべての統計量およびグラフの定義と解釈について解説します。

長さ

時系列に含まれる観測値の数。

欠損値の数

時系列内の欠損値の数。

移動平均の長さ

移動平均の長さは、Minitabで移動平均を計算するために使用する、連続する観測値の数です。たとえば、月次データの場合、値3は、3月の移動平均が、3月、2月、および1月の観測値の平均であることを意味します。

移動平均の長さにより、平滑化の量を調整します。通常は、データを十分に平滑化して雑音(不規則な変動)を減らし、パターンが明確になるようにすることができます。ただし、重要な詳細が失われるまでデータを平滑化しないでください。値を小さくすると、平滑な線ではなくなります。値を大きくすると、より平滑な線になります。
移動平均 = 2
移動平均 = 6

MAPE

平均絶対パーセント誤差(MAPE)では、精度を誤差のパーセント値として表します。MAPEはパーセント値であるため、他の測度統計量よりも容易に理解できます。たとえば、MAPEが5の場合、予測値は平均で5%外れます。

ただし、データに対するモデルの適合度が高いように見える場合でも、MAPEの値が非常に大きくなることがあります。プロットを調べ、いずれかのデータ値が0に近いかどうか確認します。MAPEでは絶対誤差を実際のデータで除算するため、値が0に近いとMAPEの値が非常に大きくなります。

解釈

異なる時系列モデルの適合度を比較するために使用します。値が小さいほど適合性が高いことを示します。単一のモデルに、3つすべての精度の測度の最低値が含まれていない場合、通常はMAPEが優先される測定方法となります。

精度の測度は、1期間先の残差に基づいています。各時点でこのモデルを使用して、時系列における次の期間のY値を予測します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりから始まる1期間を予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べて、特に系列の終わりにおいてその予測とモデルがデータに密接に従うことを確認する必要があります。

MAD

平均絶対偏差(MAD)により、データと同じ単位で精度を表現し、誤差の量を概念化することができます。外れ値の影響は、MSDの場合よりMADの場合のほうが小さくなります。

解釈

異なる時系列モデルの適合度を比較する目的で使用します。値が小さいほど適合性が高いことを示します。

精度の測度は、1期間先の残差に基づいています。このモデルは、各時点において、時系列の次の期間におけるY値を予測する目的で使用します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりから始まる1期間について予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べ、特に系列の終わりに、その予測値とモデルがデータに密接に従うことを確認する必要があります。

MSD

平均平方偏差(MSD)により、当てはめられた時系列の値の精度を測定します。外れ値の影響は、MADの場合よりMSDの場合のほうが大きくなります。

解釈

異なる時系列モデルの適合度を比較する目的で使用します。値が小さいほど適合性が高いことを示します。

精度の測度は、1期間先の残差に基づいています。このモデルは、各時点において、時系列の次の期間におけるY値を予測する目的で使用します。予測値(適合度)と実際のY値の差は、1期間先の残差です。このため、この精度の測度は、データの終わりからの1期間を予測する場合に期待される精度を示します。したがって、1期間より先の予測の精度を示すものではありません。予測でモデルを使用する場合は、精度の測度のみに基づいて決定しないでください。モデルの適合度も調べて、特に系列の終わりにその予測とモデルがデータに密接に従うことを確認する必要があります。

MA(移動平均)

移動平均値は、連続する観測値から計算されます。たとえば、移動平均長さが3の月次データの場合、3月の移動平均は、3月、2月、および1月の観測値の平均です。

予測(または適合)

時間tの予測値は、時間t-1での移動平均値と等しくなります。

観測値からの差が非常に大きな予測値を含む観測値は、異常な観測値か、または影響力のある観測値である可能性があります。外れ値がある場合は、その原因を特定します。データ入力や測定の誤差はすべて修正します。異常な1回だけの事象(特殊原因)に関連付けられたデータ値を除外することを検討してください。それから、分析を繰り返します。

誤差

誤差値は残差とも呼ばれます。誤差値は、観測値と予測値の差です。

解釈

誤差値をプロットして、モデルが適合するかどうかを判断します。誤差値は、データに対するモデルの適合度を示す有効な情報です。一般に、誤差値は0付近にランダムに分布し、明確なパターンや異常値を示しません。

期間

Minitabには、予測を行う期間が表示されます。期間は、予測の時間単位です。予測は、デフォルトでデータの終わりに開始されます。

予測

予測値は、時系列モデルから得られる適合値です。Minitabには、指定する予測の数が表示されます。予測は、データの終わりか、指定する原点で開始されます。

解釈

予測を使用して、指定した期間における変動を予測します。たとえば倉庫管理者は、過去60か月間の注文状況に基づいて、向こう3か月間の製品の発注量をモデル化することができます。

プロットでの適合値と予測値を調べて、正確な予測になる確率が高いかどうか判断します。予測値は、一般に系列の終わりにデータに従います。適合値が系列の終わりにデータからずれる場合、その予測は正確ではない可能性があります。移動平均から得られる予測値は一定であるため、データにトレンドが存在しないようにしてから予測することが重要です。予測する前にトレンドが存在していると、予測が正確でなくなる可能性が高くなります。

移動平均から得られる予測は、最新の水準の推定のみに基づいており、トレンドの推定はないため、非常に保守的です。通常は、6期間先までの範囲についてのみ予測を行ってください。

下側と上側

下側予測限界と上側予測限界により、各予測の予測区間を設定します。予測区間とは、予測値が含まれる可能性がある範囲です。たとえば、予測区間が95%の場合は、指定した時間における予測値が予測区間に含まれると、95%の信頼度で確信できます。

移動平均プロット

移動平均プロットには、観測値と時間の関係が表示されます。このプロットには、移動平均から計算される適合値、予測値、移動平均の長さ、および精度の測度が含まれます。適合値の代わりに平滑化値を表示する設定を選択することもできます。

解釈

平滑化プロットを調べて、モデルがデータに適合するかどうかを判断します。適合値が実際のデータに密接に従う場合、モデルはデータに適合します。
  • モデルがデータに適合する場合は、1系列指数平滑化を実行し、2つのモデルを比較できます。
  • モデルがデータに適合しない場合は、プロットにトレンドまたは季節性があるかどうか調べます。トレンドまたは季節性の証拠が認められる場合は、別の時系列分析を使用してください。詳細は、使用する時系列分析を参照してください。

この平滑化プロットでは適合値がデータに密接に従っており、これは、そのモデルがデータに適合することを示しています。

残差のヒストグラム

残差のヒストグラムには、すべての観測値の残差の分布が表示されます。モデルがデータによく適合する場合は、平均が0のランダム分布になります。したがって、ヒストグラムは、0を中心とするほぼ対称な形になります。

残差の正規確率プロット

残差の正規プロットには、分布が正規分布する場合の残差と期待値の関係が表示されます。

解釈

残差の正規プロットを使用して、残差が正規分布かどうかを判断します。ただし、この分析には、正規分布した残差は不要です。

残差が正規分布の場合、残差の正規の確率プロットは直線に近似します。次のパターンは、残差が正規分布していないことを示唆しています。

S曲線は、長い裾を持つ分布を示唆しています。

逆S曲線は、短い裾を持つ分布を示唆しています。

下向きの曲線は、右方向の歪みを示唆しています。

少数の点が直線から離れている場合は、外れ値のある分布を示唆しています。

残差対適合値

残差対適合値プロットでは、y軸に残差が、x軸に適合値が表示されます。

解釈

残差対適合値プロットを使用して、残差に偏りがなく、均一分散かどうかを判断します。理想的なのは、各点が0の両側にランダムにプロットされ、認識可能なパターンが存在しない状態です。

次の表のパターンは、残差が偏っており、不均一分散であることを示す可能性があります。
パターン パターンが示す意味
残差が適合値周辺に扇状または不均等に分散している 不均一分散
曲線 高次の項の欠損
ゼロから遠い点 外れ値

残差に不均一分散またはパターンがある場合、予測は正確ではない可能性があります。

残差対データ順序

残差対データ順序プロットには、データの収集順に残差が表示されます。

解釈

残差対データ順序プロットを使用して、観測期間に観測された値と比較した適合値の正確さを確認します。各点におけるパターンは、モデルがデータに適合しないことを示す可能性があります。理想的には、プロットの残差が中心線の周囲にランダムにプロットされます。

次のパターンは、モデルがデータに適合しないことを示す可能性があります。
パターン パターンが示す意味
一貫した長期トレンド モデルはデータに適合しない
短期トレンド パターンにおけるシフトまたは変化
その他の点から遠い点 外れ値
点での突然のシフト データの基本的なパターンが変更された
以下は、モデルがデータに適合しないことを示す可能性があるパターンの例です。

残差は、観測値の順序が左から右に向かって増加するにつれて体系的に減少します。

残差の値が低(左)から高(右)に急激に変化しています。

残差対変数

残差対変数プロットには、別の変数に対する残差の値が表示されます。

解釈

このプロットを使用して、変数が系統的に応答に影響するかどうかを判断します。残差にパターンがある場合、その他の変数が応答に関連付けられます。この情報は、追加調査の基本として参考にすることができます。