Um analista de marketing quer usar um modelo ARIMA para gerar previsões de curto prazo para as vendas de um produto shampoo. O analista coleta dados de vendas dos três anos anteriores. Em um gráfico de séries temporédias, o analista vê que a tendência de dados é maior. Este padrão indica que a média dos dados não está estacionária. O analista realiza um teste de Dickey-Fuller aumentado para determinar a ordem de diferenciação não sazonal para incluir no modelo ARIMA. Para obter mais informações sobre modelos ARIMA, acesse Visão geral de ARIMA.
Nestes resultados, a estatística de teste de 2,29045 é maior que o valor crítico de -2,96053. Como os resultados não rejeitam a hipótese nula de que os dados não são estacionários, a recomendação do teste é considerar a primeira ordem diferença para tornar os dados estacionários.
Ordem máxima de lag para termos no modelo de regressão | 9 |
---|---|
Critério para selecionar ordem de lag | AIC mínimo |
Termos adicionais | Constante |
Ordem de lag selecionada | 4 |
Linhas usadas | 36 |
Hipótese nula: | Os dados são não-estacionários |
---|---|
Hipótese alternativa: | Os dados são estacionários |
Estatística de teste | Valor-p | Recomendação |
---|---|---|
2,29045 | 0,999 | Estatística de teste > valor crítico de -2,96053. |
Nível de significâncial = 0,05 | ||
Não rejeitou a hipótese nula. | ||
Considere diferenciação para tornar os dados estacionários. |
As tramas da série time mostram o resultado da diferença. Nesses resultados, o enredo da série temporal dos dados originais mostra uma tendência clara. O enredo da série temporal dos dados diferenciados mostra as diferenças entre valores consecutivos. Os dados diferenciados aparecem estacionários porque os pontos seguem um caminho horizontal sem padrões óbvios na variação.
As gráficos ACF também mostram o efeito da diferença. Nestes resultados, o gráfico ACF dos dados originais mostra picos lentamente reduzidos entre os atrasos. Este padrão indica que os dados não estão parados. Na gráfico ACF dos dados diferenciados, o único pico que é significativamente diferente de 0 é o lag 1.
Nestes resultados, as gráfico da série temporal e as gráficos da ACF confirmam os resultados do teste. Portanto, uma abordagem razoável é a diferença dos dados e, em seguida, encaixar um modelo médio autoregressivo e móvel para fazer previsões.