최상의 ARIMA 모형으로 예측 계절 모델의 예

한 분석가가 108개월 동안 항공사 승객 수에 대한 데이터를 수집했습니다. 분석가는 ARIMA 모델을 사용하여 데이터에 대한 예측을 생성하려고 합니다. 분석가는 이전에 데이터의 시계열 플롯을 조사하고 계절주기의 변동이 시간이 지남에 따라 증가한다는 것을 관찰했습니다. 분석가는 데이터의 자연스러운 로그 변환이 적절하다고 결론지었습니다. 변환 후 분석가는 변환된 데이터의 시계열 플롯과 변환된 데이터의 ACF(자기 상관 함수) 플롯을 조사했습니다. 두 플롯 모두 모델의 시작점은 비계절적 차이 보관의 순서에 대해 1을, 계절 차이 보관의 순서에 대해 1을 선택하는 것임을 제안합니다. 분석가는 향후 3개월 동안 예측을 요청합니다.

  1. 표본 데이터 항공승객.mtw를 엽니다.
  2. 통계분석 > 시계열 > 최상의 ARIMA 모형으로 예측을 선택합니다.
  3. 시계열에서 승객 수를 입력합니다.
  4. 에서 1을 선택합니다차분 순서 d.
  5. 해당 기간에 대해 12를 선택하고 기간이 있는 계절별 모형 적합 입력합니다.
  6. 에서 1을 선택합니다계절별 차분 순서 D.
  7. 예측 수3을 입력합니다.
  8. 옵션을 선택합니다.
  9. Box-Cox 변환에서 λ = 0(자연 로그)를 선택합니다.
  10. 각 대화 상자에서 확인를 클릭합니다.

결과 해석

모델 선택 테이블은 AICc에 의해 순서대로 검색에서 모델의 순위를 매깁니다. ARIMA(0, 1, 1)(1, 1, 0) 모델에는 AICc가 가장 적습니다. 다음 ARIMA 결과는 ARIMA(0, 1, 1)(1, 1, 0) 모델에 대한 것입니다.

매개변수 테이블의 p-값은 모형 항이 0.05 수준에서 유의하다는 것을 보여줍니다. 분석가는 계수가 모델에 속한다는 결론을 내립니다. 수정된 박스-피어스(Ljung-Box) 통계에 대한 p-값은 모두 0.05 레벨에서 중요하지 않습니다. 잔차의 ACF 및 잔차의 PACF는 지연(24)에서 스파이크를 나타낸다. 높은 지연 숫자에서 큰 스파이크는 일반적으로 거짓 긍정이고 테스트 통계는 모두 중요하지 않기 때문에 분석가는 모형이 잔차가 독립적이라는 가정을 충족한다는 결론을 내립니다. 분석가는 예측을 검토하는 것이 합리적이라고 결론지었습니다.

* 경고 * 상수 항을 포함하지 않는 추정 불가능한 ARIMA(p, d, q)(P, D, Q) 모형:
(2, 1, 1)(1, 1, 1)

방법

계절 기간12
최상의 모형에 대한 기준최소 AICc
Box-Cox 변환 
    사용자 지정 λ0
    변환된 계열 = ln(승객 수) 
사용된 행108
사용되지 않은 행0

모형 선택

모델(d = 1, D = 1)로그 우도AICcAICBIC
p = 0, q = 1, P = 1, Q = 0*243.477-480.690-480.954-473.292
p = 2, q = 0, P = 0, Q = 1243.903-479.362-479.806-469.590
p = 1, q = 1, P = 1, Q = 0243.496-478.547-478.992-468.776
p = 0, q = 2, P = 1, Q = 0243.480-478.516-478.961-468.745
p = 2, q = 0, P = 1, Q = 1244.424-478.174-478.848-466.079
p = 0, q = 1, P = 0, Q = 0237.930-471.729-471.859-466.752
p = 1, q = 2, P = 0, Q = 0239.930-471.415-471.859-461.644
p = 1, q = 1, P = 0, Q = 0237.929-469.594-469.858-462.196
p = 0, q = 2, P = 0, Q = 0237.924-469.584-469.848-462.186
p = 1, q = 0, P = 0, Q = 1237.442-468.619-468.883-461.221
p = 1, q = 0, P = 1, Q = 1237.551-466.658-467.102-456.887
p = 2, q = 2, P = 0, Q = 0238.267-465.860-466.534-453.765
p = 2, q = 0, P = 0, Q = 0232.478-458.693-458.957-451.295
p = 0, q = 0, P = 0, Q = 1226.062-447.993-448.124-443.016
p = 0, q = 0, P = 1, Q = 1226.282-446.300-446.563-438.902
p = 2, q = 1, P = 0, Q = 0226.105-443.766-444.211-433.995
p = 1, q = 0, P = 0, Q = 0222.409-440.687-440.818-435.710
p = 2, q = 0, P = 1, Q = 0220.456-432.467-432.911-422.696
p = 0, q = 0, P = 1, Q = 0218.236-432.342-432.472-427.364
p = 1, q = 2, P = 1, Q = 1220.708-428.461-429.416-414.092
p = 0, q = 2, P = 0, Q = 1215.116-421.787-422.232-412.016
p = 0, q = 1, P = 0, Q = 1213.007-419.751-420.015-412.353
p = 2, q = 1, P = 0, Q = 1214.469-418.265-418.939-406.169
p = 1, q = 0, P = 1, Q = 0211.232-416.199-416.463-408.801
p = 2, q = 2, P = 0, Q = 1213.877-414.799-415.754-400.431
p = 2, q = 2, P = 1, Q = 1214.698-414.109-415.397-397.520
p = 1, q = 2, P = 0, Q = 1211.492-412.310-412.984-400.215
p = 1, q = 1, P = 0, Q = 1208.149-407.854-408.299-398.083
p = 0, q = 1, P = 1, Q = 1204.745-401.046-401.490-391.275
p = 0, q = 2, P = 1, Q = 1203.978-397.282-397.956-385.187
p = 1, q = 1, P = 1, Q = 1203.564-396.453-397.127-384.358
p = 1, q = 2, P = 1, Q = 0170.812-330.950-331.624-318.855
p = 2, q = 2, P = 1, Q = 0167.845-322.735-323.690-308.367
p = 2, q = 1, P = 1, Q = 0-202.538415.751415.076427.846
* 최소 AICc를 가진 최상의 모델. 최상의 모델에 대한 출력은 다음과 같습니다.

모수의 최종 추정치

유형계수SE 계수T-값P-값
SAR  12-0.4030.103-3.920.000
MA   10.87040.051017.080.000
차분 계산: 1 정규, 1 계절 12 순서
차분 계산 후 관측치 수: 95

모형 요약

DFSSMSMSDAICcAICBIC
930.03113260.00033480.0003277-480.690-480.954-473.292
MS = 백색 잡음 계열의 분산

수정된 Box-Pierce(Ljung-Box) 카이-제곱 통계량

시차12243648
카이-제곱9.4726.4433.9950.66
DF10223446
P-값0.4890.2330.4680.295
* 경고 * 상수 항을 포함하지 않는 추정 불가능한 ARIMA(p, d, q)(P, D, Q) 모형:
(2, 1, 1)(1, 1, 1)

원본 시계열



95% 한계
기간예측하한상한실제
109168226641622724217434097 
110208238762008075121587153 
111208267022007744321596450 

변환된 시계열




95% 한계
기간예측SE 예측하한상한실제
10916.63810.018296416.602216.6739 
11016.85140.018449516.815316.8876 
11116.85160.018601416.815116.8880