Trabalho na íntegra - PET – Estatística UFPR

Transcrição

Trabalho na íntegra - PET – Estatística UFPR
Previsão da inflação do indicador IGP-M através de
um modelo ARIMA
Mauricio Mattos
Junho de 2014
Resumo
Esse trabalho visa identificar um modelo ARIMA que seja efetivo na descrição
e predição dos valores da série temporal da inflação do Índice Geral de Preços
- Mercado (IGP-M), no perı́odo de junho de 2005 até junho de 2009. O IGPM acompanha os preços nas mais diversas áreas do processo produtivo nacional,
e sofre constantes inflações e deflações. Buscou-se, então, o modelo ARIMA que
melhor descrevesse os dados escolhidos e, após isso, foi realizada a previsão dos
valores da série nos próximos seis meses (de julho a dezembro de 2009). O melhor
modelo encontrado foi o ARIMA(1,0,0), ou então AR(1), cuja previsão foi correta
considerando um intervalo de confiança de 75%.
1
Introdução
O indicador Índice Geral de Preços foi criado pela Fundação Getúlio Vargas (FGV), com
a finalidade de acompanhar a inflação e deflação de preços ao longo do tempo, e possui
três versões, sendo que a que será abordada nesse trabalho será o Índice Geral de Preços Mercado (IGP-M). O IGP-M é uma medida abrangente, que trata do movimento do preço
nas grandes áreas produtivas do paı́s (atacado, varejo e construção civil), sendo a média
ponderada do Índice de Preços por Atacado (IPA-M), o Índice de Preços ao Consumidor
(IPC-M) e o Índice Nacional de Custo da Construção (INCC-M). O IGP-M é apurado do
dia 21 do mês anterior até o dia 20 do mês de referência, e é utilizado principalmente na
correção de valores contratuais, em especial dos contratos de locação e de energia elétrica.
O conjunto de dados da inflação do IGP-M ao longo dos anos está disponı́vel no sı́tio
virtual do IPEA1 , e por se tratar de uma série temporal (dados coletados ao longo do
tempo), pode-se aplicar uma diversidade de modelos estatı́sticos para analisar o comportamento da série e também prever seus valores futuros. Nesse trabalho, foi utilizado o
modelo ARIMA, que descreve e prevê uma série temporal através de um modelo autoregressivo, um modelo integrado e um modelo de médias móveis.
Para o estudo a seguir, buscou-se um modelo ARIMA que descreve os dados de inflação do
IGP-M do perı́odo de junho de 2005 até junho de 2009, e então foi feita uma previsão das
seis observações futuras e comparação das previsões com os valores reais, para descobrir
se a previsão é efetiva ou não.
1
http://www.ipeadata.gov.br/
1
2
2.1
2.1.1
Revisão da Literatura
O Modelo ARIMA
AR(p)
Um modelo auto-regressivo de ordem p, representado como AR(p), descreve o valor de
uma observação de uma série temporal através da atribuição de pesos as p observações
anteriores, da seguinte forma:
zt = φ1 zt−1 + φ2 zt−2 + ... + φp zt−p + at
(1)
Onde zt é o valor observado no tempo t, φj representa o peso de cada observação e at é o
ruı́do branco da observação t.
2.1.2
MA(q)
O processo de médias móveis, representado por MA(q), é semelhante ao processo AR(p),
porém, ao invés de definir a observação atual através da atribuição de peso as observações
anteriores, constrói-se a observação zt através da atribuição de peso aos ruı́dos brancos
das observações passadas.
zt = at − θ1 at−1 − θ2 at−2 − ... − θq at−q
2.1.3
(2)
ARMA(p, q)
Uma forma de descrever melhor uma série temporal é através da junção do modelo autoregressivo com o modelo de médias móveis, formando o modelo ARMA(p, q), que pode
ser escrito da maneira a seguir:
zt = φ1 zt−1 + ... + φp zt−p + at − θ1 at−1 − ... − θq at−q
2.1.4
(3)
I(d)
Os modelos AR(p), MA(q) e ARMA(p, q) podem ser aplicados somente em séries estacionárias, ou seja, séries temporais que não possuam tendência e que suas média e variância
sejam constantes. Contudo, séries temporais reais nem sempre seguem um padrão estacionário, e para contornar essa situação, toma-se a diferença da série.
∆zt = zt − zt−1
(4)
Na maioria dos casos, uma série temporal que sofreu uma diferença tem mais chances de
ser estacionária do que a série original. Portanto, sugere-se que tome a diferença de uma
série d vezes, até que ela se torne estacionária.
2.1.5
ARIMA(p, d, q)
Quando uma série não é estacionária, a aplicação de um modelo ARMA(p, q) é prejudicada. Para isso, aplica-se a diferenciação na série, tendo-se assim um modelo autoregressivo, integrado e de médias móveis, denominado ARIMA(p, d, q), representado a
seguir.
∆d zt = φ1 ∆d zt−1 + ... + φp ∆d zt−p + at − θ1 at−1 − ... − θq at−q
Sendo d o número de diferenças necessárias para tornar a série estacionária.
2
(5)
2.2
Teste de Dickey-Fuller
Existe uma ampla gama de métodos para avaliar se uma série temporal é estacionária ou
não. Para esse trabalho, o modelo de avaliação utilizado foi o teste de Dickey-Fuller. Esse
teste consiste em um teste de hipótese, em que:
H0 : A série não é estacionária
H1 : A série é estacionária
O teste de Dickey-Fuller segue a estatı́stica τ , em que a hipótese nula é rejeitada quando
τcalculado < τtabelado e não rejeitada quando o τcalculado não é menor do que o τtabelado .
Para encontrar o valor de τcalculado , faz-se uma regressão das primeiras diferenças da série
(∆zt ) em relação a zt−1 . Então, divide-se o coeficiente estimado de zt−1 pelo seu desvio
padrão, e obtém-se o τcalculado .
Os valores tabelados de τ para um nı́vel de significância de 1% (nı́vel utilizado nessa
pesquisa) encontram-se na tabela 1. Caso seja identificado que a série não é estacionária,
deve-se tomar mais uma diferença e reaplicar o teste, até que a estacionariedade seja
atingida.
Tamanho
da amostra τtabelado
25
−3.75
50
−3.58
100
−3.51
250
−3.46
500
−3.44
∞
−3.43
Tabela 1: Valores do teste Dickey-Fuller para nı́vel de significância de 1%
2.3
Critério de Informação de Akaike
Uma das partes mais complexas da obtenção de um modelo ARIMA(p, d, q) é a definição
de quais valores devem ser atribuı́dos para p, d e q. O valor d pode ser encontrado através
do número de diferenças que torna a série estacionária. Akaike (1973, 1974) sugeriu a
utilização de um modelo para definição dos melhores valores para p e q, que pode ser
resumido da seguinte forma:
2
AIC(k, l) = lnσk,l
+
2(k + l)
N
(6)
Sendo k e l os valores de p e q, respectivamente, do modelo ARMA(p, q) que se deseja
2
calcular o critério. σk,l
representa o estimador de máxima verossimilhança e N é o número
de observações da série. A ideia do modelo é escolher os valores de k e l que minimizam
o valor de AIC, indicando que são os melhores valores para a definição de um modelo
ARMA(k, l).
3
3
Resultados
Os dados a seguir representam a inflação do ı́ndice IGP-M (Índice Geral de Preços - Mercado), do perı́odo de junho de 2005 até junho de 2009, totalizando 49 observações. O
gráfico da série temporal utilizada está retratado a seguir.
Figura 1: Série original (Inflação IGP-M)
O primeiro passo é verificar se a série é estacionária ou não. Para isso, foi aplicado o teste
de Dickey-Fuller, obtendo-se um coeficiente de −0.44268, com desvio padrão de 0.12034,
o que resulta em um τcalculado de −3.679. Esse valor é inferior ao valor tabelado de −3.58,
indicando a rejeição da hipótese nula, concluindo-se que a série é estacionária, não sendo
necessário diferenciar a série. Portanto, o modelo ARIMA(p, d, q) aplicado será da forma
ARIMA(p, 0, q), ou seja, um modelo ARMA(p, q).
Com o auxı́lio do pacote forecast, do software R, utilizou-se a função auto.arima, que
indica o melhor modelo ARIMA(p, d, q) para ser utilizado na série em questão. Para a
série, o melhor modelo indicado pelo software foi o modelo ARIMA(1,0,0) (um coeficiente auto-regressivo, nenhuma diferenciação e nenhum coeficiente de média móvel), com
φ1 = 0.5664 e uma constante de valor 0.3448.
Para verificar se esse modelo é realmente o melhor, foi aplicado o critério AIC para quinze
modelos ARIMA, buscando aquele que retorna um menor valor para AIC (os resultados
são mostrados na tabela 2).
Analisando os quinze modelos selecionados, conclui-se que o mais indicado a ser utilizado é o ARIMA(1,0,0), pois indica o menor valor para AIC (81.59801). O modelo
ARIMA(1,0,0), aplicado a série da inflação do ı́ndice IGP-M é:
zt = 0.5664zt−1 + 0.3448
(7)
Para prever o valor das seis observações futuras, foi utilizada a função forecast, ainda
do pacote forecast, considerando intervalos de confiança de 75% e de 95%. No gráfico
a seguir, a linha azul escura representa o valor das previsões. Os tons de azul acima e
abaixo da linha de previsão representam os intervalos de confiança de 75% e 95%. Em
amarelo, estão os valores observados de julho até dezembro de 2009 (que são os valores
4
ARIMA(p,d,q)
ARIMA(0,0,1)
ARIMA(0,0,2)
ARIMA(0,0,3)
ARIMA(1,0,0)
ARIMA(1,0,1)
ARIMA(1,0,2)
ARIMA(1,0,3)
ARIMA(2,0,0)
ARIMA(2,0,1)
ARIMA(2,0,2)
ARIMA(2,0,3)
ARIMA(3,0,0)
ARIMA(3,0,1)
ARIMA(3,0,2)
ARIMA(3,0,3)
AIC
84.04078
84.68380
85.36748
81.59801
83.56444
83.78049
85.45045
83.58677
82.66424
83.58650
85.27124
83.63351
85.18628
87.11208
84.52672
Tabela 2: Valores de AIC (Inflação IGP-M)
previstos no gráfico), para critério de avaliação dos valores previstos.
Figura 2: Previsão com modelo ARIMA(1,0,0)
4
Conclusão
Observando o comportamento do gráfico presente na figura 2, percebe-se que, aplicando
um modelo ARIMA(1,0,0) (que pode também ser chamado de AR(1)) e considerando
um intervalo de confiança de 75%, a previsão feita nesse trabalho consegue descrever o
comportamento da série da inflação do IGP-M no perı́odo proposto.
5
Referências
[1] MORETTIN, P.A., TOLOI, C. M. C., Análise de Séries Temporais. 2.ed. Edgard
Blücher, 2006.
[2] SHUMWAY, R.H., STOFFER, D.S., Time Series Analysis and Its Applications:
With R Examples. 2.ed. Springer, 2006.
[3] http://portalibre.fgv.br/
6