Trabalho na íntegra - PET – Estatística UFPR
Transcrição
Trabalho na íntegra - PET – Estatística UFPR
Previsão da inflação do indicador IGP-M através de um modelo ARIMA Mauricio Mattos Junho de 2014 Resumo Esse trabalho visa identificar um modelo ARIMA que seja efetivo na descrição e predição dos valores da série temporal da inflação do Índice Geral de Preços - Mercado (IGP-M), no perı́odo de junho de 2005 até junho de 2009. O IGPM acompanha os preços nas mais diversas áreas do processo produtivo nacional, e sofre constantes inflações e deflações. Buscou-se, então, o modelo ARIMA que melhor descrevesse os dados escolhidos e, após isso, foi realizada a previsão dos valores da série nos próximos seis meses (de julho a dezembro de 2009). O melhor modelo encontrado foi o ARIMA(1,0,0), ou então AR(1), cuja previsão foi correta considerando um intervalo de confiança de 75%. 1 Introdução O indicador Índice Geral de Preços foi criado pela Fundação Getúlio Vargas (FGV), com a finalidade de acompanhar a inflação e deflação de preços ao longo do tempo, e possui três versões, sendo que a que será abordada nesse trabalho será o Índice Geral de Preços Mercado (IGP-M). O IGP-M é uma medida abrangente, que trata do movimento do preço nas grandes áreas produtivas do paı́s (atacado, varejo e construção civil), sendo a média ponderada do Índice de Preços por Atacado (IPA-M), o Índice de Preços ao Consumidor (IPC-M) e o Índice Nacional de Custo da Construção (INCC-M). O IGP-M é apurado do dia 21 do mês anterior até o dia 20 do mês de referência, e é utilizado principalmente na correção de valores contratuais, em especial dos contratos de locação e de energia elétrica. O conjunto de dados da inflação do IGP-M ao longo dos anos está disponı́vel no sı́tio virtual do IPEA1 , e por se tratar de uma série temporal (dados coletados ao longo do tempo), pode-se aplicar uma diversidade de modelos estatı́sticos para analisar o comportamento da série e também prever seus valores futuros. Nesse trabalho, foi utilizado o modelo ARIMA, que descreve e prevê uma série temporal através de um modelo autoregressivo, um modelo integrado e um modelo de médias móveis. Para o estudo a seguir, buscou-se um modelo ARIMA que descreve os dados de inflação do IGP-M do perı́odo de junho de 2005 até junho de 2009, e então foi feita uma previsão das seis observações futuras e comparação das previsões com os valores reais, para descobrir se a previsão é efetiva ou não. 1 http://www.ipeadata.gov.br/ 1 2 2.1 2.1.1 Revisão da Literatura O Modelo ARIMA AR(p) Um modelo auto-regressivo de ordem p, representado como AR(p), descreve o valor de uma observação de uma série temporal através da atribuição de pesos as p observações anteriores, da seguinte forma: zt = φ1 zt−1 + φ2 zt−2 + ... + φp zt−p + at (1) Onde zt é o valor observado no tempo t, φj representa o peso de cada observação e at é o ruı́do branco da observação t. 2.1.2 MA(q) O processo de médias móveis, representado por MA(q), é semelhante ao processo AR(p), porém, ao invés de definir a observação atual através da atribuição de peso as observações anteriores, constrói-se a observação zt através da atribuição de peso aos ruı́dos brancos das observações passadas. zt = at − θ1 at−1 − θ2 at−2 − ... − θq at−q 2.1.3 (2) ARMA(p, q) Uma forma de descrever melhor uma série temporal é através da junção do modelo autoregressivo com o modelo de médias móveis, formando o modelo ARMA(p, q), que pode ser escrito da maneira a seguir: zt = φ1 zt−1 + ... + φp zt−p + at − θ1 at−1 − ... − θq at−q 2.1.4 (3) I(d) Os modelos AR(p), MA(q) e ARMA(p, q) podem ser aplicados somente em séries estacionárias, ou seja, séries temporais que não possuam tendência e que suas média e variância sejam constantes. Contudo, séries temporais reais nem sempre seguem um padrão estacionário, e para contornar essa situação, toma-se a diferença da série. ∆zt = zt − zt−1 (4) Na maioria dos casos, uma série temporal que sofreu uma diferença tem mais chances de ser estacionária do que a série original. Portanto, sugere-se que tome a diferença de uma série d vezes, até que ela se torne estacionária. 2.1.5 ARIMA(p, d, q) Quando uma série não é estacionária, a aplicação de um modelo ARMA(p, q) é prejudicada. Para isso, aplica-se a diferenciação na série, tendo-se assim um modelo autoregressivo, integrado e de médias móveis, denominado ARIMA(p, d, q), representado a seguir. ∆d zt = φ1 ∆d zt−1 + ... + φp ∆d zt−p + at − θ1 at−1 − ... − θq at−q Sendo d o número de diferenças necessárias para tornar a série estacionária. 2 (5) 2.2 Teste de Dickey-Fuller Existe uma ampla gama de métodos para avaliar se uma série temporal é estacionária ou não. Para esse trabalho, o modelo de avaliação utilizado foi o teste de Dickey-Fuller. Esse teste consiste em um teste de hipótese, em que: H0 : A série não é estacionária H1 : A série é estacionária O teste de Dickey-Fuller segue a estatı́stica τ , em que a hipótese nula é rejeitada quando τcalculado < τtabelado e não rejeitada quando o τcalculado não é menor do que o τtabelado . Para encontrar o valor de τcalculado , faz-se uma regressão das primeiras diferenças da série (∆zt ) em relação a zt−1 . Então, divide-se o coeficiente estimado de zt−1 pelo seu desvio padrão, e obtém-se o τcalculado . Os valores tabelados de τ para um nı́vel de significância de 1% (nı́vel utilizado nessa pesquisa) encontram-se na tabela 1. Caso seja identificado que a série não é estacionária, deve-se tomar mais uma diferença e reaplicar o teste, até que a estacionariedade seja atingida. Tamanho da amostra τtabelado 25 −3.75 50 −3.58 100 −3.51 250 −3.46 500 −3.44 ∞ −3.43 Tabela 1: Valores do teste Dickey-Fuller para nı́vel de significância de 1% 2.3 Critério de Informação de Akaike Uma das partes mais complexas da obtenção de um modelo ARIMA(p, d, q) é a definição de quais valores devem ser atribuı́dos para p, d e q. O valor d pode ser encontrado através do número de diferenças que torna a série estacionária. Akaike (1973, 1974) sugeriu a utilização de um modelo para definição dos melhores valores para p e q, que pode ser resumido da seguinte forma: 2 AIC(k, l) = lnσk,l + 2(k + l) N (6) Sendo k e l os valores de p e q, respectivamente, do modelo ARMA(p, q) que se deseja 2 calcular o critério. σk,l representa o estimador de máxima verossimilhança e N é o número de observações da série. A ideia do modelo é escolher os valores de k e l que minimizam o valor de AIC, indicando que são os melhores valores para a definição de um modelo ARMA(k, l). 3 3 Resultados Os dados a seguir representam a inflação do ı́ndice IGP-M (Índice Geral de Preços - Mercado), do perı́odo de junho de 2005 até junho de 2009, totalizando 49 observações. O gráfico da série temporal utilizada está retratado a seguir. Figura 1: Série original (Inflação IGP-M) O primeiro passo é verificar se a série é estacionária ou não. Para isso, foi aplicado o teste de Dickey-Fuller, obtendo-se um coeficiente de −0.44268, com desvio padrão de 0.12034, o que resulta em um τcalculado de −3.679. Esse valor é inferior ao valor tabelado de −3.58, indicando a rejeição da hipótese nula, concluindo-se que a série é estacionária, não sendo necessário diferenciar a série. Portanto, o modelo ARIMA(p, d, q) aplicado será da forma ARIMA(p, 0, q), ou seja, um modelo ARMA(p, q). Com o auxı́lio do pacote forecast, do software R, utilizou-se a função auto.arima, que indica o melhor modelo ARIMA(p, d, q) para ser utilizado na série em questão. Para a série, o melhor modelo indicado pelo software foi o modelo ARIMA(1,0,0) (um coeficiente auto-regressivo, nenhuma diferenciação e nenhum coeficiente de média móvel), com φ1 = 0.5664 e uma constante de valor 0.3448. Para verificar se esse modelo é realmente o melhor, foi aplicado o critério AIC para quinze modelos ARIMA, buscando aquele que retorna um menor valor para AIC (os resultados são mostrados na tabela 2). Analisando os quinze modelos selecionados, conclui-se que o mais indicado a ser utilizado é o ARIMA(1,0,0), pois indica o menor valor para AIC (81.59801). O modelo ARIMA(1,0,0), aplicado a série da inflação do ı́ndice IGP-M é: zt = 0.5664zt−1 + 0.3448 (7) Para prever o valor das seis observações futuras, foi utilizada a função forecast, ainda do pacote forecast, considerando intervalos de confiança de 75% e de 95%. No gráfico a seguir, a linha azul escura representa o valor das previsões. Os tons de azul acima e abaixo da linha de previsão representam os intervalos de confiança de 75% e 95%. Em amarelo, estão os valores observados de julho até dezembro de 2009 (que são os valores 4 ARIMA(p,d,q) ARIMA(0,0,1) ARIMA(0,0,2) ARIMA(0,0,3) ARIMA(1,0,0) ARIMA(1,0,1) ARIMA(1,0,2) ARIMA(1,0,3) ARIMA(2,0,0) ARIMA(2,0,1) ARIMA(2,0,2) ARIMA(2,0,3) ARIMA(3,0,0) ARIMA(3,0,1) ARIMA(3,0,2) ARIMA(3,0,3) AIC 84.04078 84.68380 85.36748 81.59801 83.56444 83.78049 85.45045 83.58677 82.66424 83.58650 85.27124 83.63351 85.18628 87.11208 84.52672 Tabela 2: Valores de AIC (Inflação IGP-M) previstos no gráfico), para critério de avaliação dos valores previstos. Figura 2: Previsão com modelo ARIMA(1,0,0) 4 Conclusão Observando o comportamento do gráfico presente na figura 2, percebe-se que, aplicando um modelo ARIMA(1,0,0) (que pode também ser chamado de AR(1)) e considerando um intervalo de confiança de 75%, a previsão feita nesse trabalho consegue descrever o comportamento da série da inflação do IGP-M no perı́odo proposto. 5 Referências [1] MORETTIN, P.A., TOLOI, C. M. C., Análise de Séries Temporais. 2.ed. Edgard Blücher, 2006. [2] SHUMWAY, R.H., STOFFER, D.S., Time Series Analysis and Its Applications: With R Examples. 2.ed. Springer, 2006. [3] http://portalibre.fgv.br/ 6