使用最佳 ARIMA 模型进行预测 季节性模型的示例

一位分析师收集了108个月的航空公司乘客人数数据。分析师希望使用 ARIMA 模型为数据生成预测。该分析师之前检查了数据的时间序列图,并观察到季节性周期的变化随时间而增加。分析师的结论是,对数据进行自然对数转换是合适的。转换后,分析人员检查了已转换数据的时间序列图和已转换数据的自相关函数 (ACF) 图。这两个图都表明,模型的起点是选择 1 作为非季节性差分的顺序,选择 1 作为季节性差分的顺序。分析师要求对未来 3 个月进行预测。

  1. 打开样本数据 航空乘客.mtw
  2. 选择 统计 > 时间序列 > 使用最佳 ARIMA 模型进行预测
  3. 序列中,输入乘客人数
  4. 在中差分阶次 d,选择 1
  5. 选择 将季节性模型与周期拟合 并输入 12 作为时间段。
  6. 在中季节性差分阶次 D,选择 1
  7. 预测点数中,输入 3
  8. 选择选项
  9. Box-Cox 变换中,选择 λ = 0 (自然对数)
  10. 单击每个对话框中的确定

解释结果

模型选择表按 AICc 的顺序对搜索中的模型进行排名。ARIMA(0, 1, 1)(1, 1, 0) 模型具有最少的 AICc。下面的 ARIMA 结果适用于 ARIMA(0, 1, 1)(1, 1, 0) 模型。

参数表中的 p 值表明模型项在 0.05 水平上是显著的。分析人员得出结论,系数属于模型。修改后的箱形皮尔斯 (Ljung-Box) 统计量的 p 值在 0.05 水平上都是微不足道的。残差的 ACF 和残差的 PACF 在滞后 24 处显示峰值。由于高滞后数处的大峰值通常是误报,并且检验统计量都无关紧要,因此分析人员得出结论,该模型符合残差独立的假设。分析师的结论是,对预测的检查是合理的。

* 警告 * 不包含常量项的不可估计的 ARIMA(p, d, q)(P, D, Q) 模型:
(2, 1, 1)(1, 1, 1)

方法

季节周期12
最佳模型的标准最小 AICc
Box-Cox 变换 
    用户指定的 λ0
    已变换的序列 = ln(乘客人数) 
已使用的行数108
未使用的行0

模型选择

模型 (d = 1, D = 1)对数似然AICcAICBIC
p = 0, q = 1, P = 1, Q = 0*243.477-480.690-480.954-473.292
p = 2, q = 0, P = 0, Q = 1243.903-479.362-479.806-469.590
p = 1, q = 1, P = 1, Q = 0243.496-478.547-478.992-468.776
p = 0, q = 2, P = 1, Q = 0243.480-478.516-478.961-468.745
p = 2, q = 0, P = 1, Q = 1244.424-478.174-478.848-466.079
p = 0, q = 1, P = 0, Q = 0237.930-471.729-471.859-466.752
p = 1, q = 2, P = 0, Q = 0239.930-471.415-471.859-461.644
p = 1, q = 1, P = 0, Q = 0237.929-469.594-469.858-462.196
p = 0, q = 2, P = 0, Q = 0237.924-469.584-469.848-462.186
p = 1, q = 0, P = 0, Q = 1237.442-468.619-468.883-461.221
p = 1, q = 0, P = 1, Q = 1237.551-466.658-467.102-456.887
p = 2, q = 2, P = 0, Q = 0238.267-465.860-466.534-453.765
p = 2, q = 0, P = 0, Q = 0232.478-458.693-458.957-451.295
p = 0, q = 0, P = 0, Q = 1226.062-447.993-448.124-443.016
p = 0, q = 0, P = 1, Q = 1226.282-446.300-446.563-438.902
p = 2, q = 1, P = 0, Q = 0226.105-443.766-444.211-433.995
p = 1, q = 0, P = 0, Q = 0222.409-440.687-440.818-435.710
p = 2, q = 0, P = 1, Q = 0220.456-432.467-432.911-422.696
p = 0, q = 0, P = 1, Q = 0218.236-432.342-432.472-427.364
p = 1, q = 2, P = 1, Q = 1220.708-428.461-429.416-414.092
p = 0, q = 2, P = 0, Q = 1215.116-421.787-422.232-412.016
p = 0, q = 1, P = 0, Q = 1213.007-419.751-420.015-412.353
p = 2, q = 1, P = 0, Q = 1214.469-418.265-418.939-406.169
p = 1, q = 0, P = 1, Q = 0211.232-416.199-416.463-408.801
p = 2, q = 2, P = 0, Q = 1213.877-414.799-415.754-400.431
p = 2, q = 2, P = 1, Q = 1214.698-414.109-415.397-397.520
p = 1, q = 2, P = 0, Q = 1211.492-412.310-412.984-400.215
p = 1, q = 1, P = 0, Q = 1208.149-407.854-408.299-398.083
p = 0, q = 1, P = 1, Q = 1204.745-401.046-401.490-391.275
p = 0, q = 2, P = 1, Q = 1203.978-397.282-397.956-385.187
p = 1, q = 1, P = 1, Q = 1203.564-396.453-397.127-384.358
p = 1, q = 2, P = 1, Q = 0170.812-330.950-331.624-318.855
p = 2, q = 2, P = 1, Q = 0167.845-322.735-323.690-308.367
p = 2, q = 1, P = 1, Q = 0-202.538415.751415.076427.846
* 具有最小 AICc 的最佳模型。最佳模型的输出如下。

参数的最终估计值

类型系数系数标准误T 值P 值
SAR  12-0.4030.103-3.920.000
MA   10.87040.051017.080.000
差值: 1 正规, 阶数 12 的 1 季节
进行差值处理后的观测值数: 95

模型汇总

自由度SSMS平均偏差平方和AICcAICBIC
930.03113260.00033480.0003277-480.690-480.954-473.292
MS = 白噪声序列的方差

修正 Box-Pierce(Ljung-Box) 卡方统计量

滞后 (Lag)12243648
卡方9.4726.4433.9950.66
自由度10223446
P 值0.4890.2330.4680.295
* 警告 * 不包含常量项的不可估计的 ARIMA(p, d, q)(P, D, Q) 模型:
(2, 1, 1)(1, 1, 1)

原始序列



95% 限值
时间周期预测下限上限实际
109168226641622724217434097 
110208238762008075121587153 
111208267022007744321596450 

已变换的序列




95% 限值
时间周期预测SE 预测下限上限实际
10916.63810.018296416.602216.6739 
11016.85140.018449516.815316.8876 
11116.85160.018601416.815116.8880