INTRODUÇÃO  

O objeto deste artigo consiste na análise e demonstração dos resultados do estudo “Aplicação do Modelo ARIMA à Previsão do Preço das Commodities Agrícolas Brasileiras” de Sinézio Maia, Marianne Oliveira, Elenildes Pereira, Pablo Pinto e José dos Santos, publicado no ano de 2008, que aborda o problema da influência da oscilação dos preços das commodities (bens primários exportáveis cotados a nível internacional) no mercado mundial sobre o volume de exportação e a receita dos produtores de cada produto.

No Brasil, esses bens têm peso relevante na formação do PIB (Produto Interno Bruto), tal como ocorrido em 2005, como destacam os autores, ano no qual se pôde observar que, da produção total do setor agrícola: soja representou 30%, cana de açúcar 10%, café beneficiado 7,5%, laranja 2,5% e cacau em amêndoas 1%. Juntos, esses produtos significaram mais de 52% do valor bruto produzido pelo setor no país. Tal relevância quantitativa justificou esse estudo de Maia et al (2008), dado que revela a importância de tais commodities na produção brasileira.

Além disso, naquele período observado pela pesquisa de Maia et al (2008), o Brasil se configurava como o segundo maior exportador de soja, o maior produtor e exportador de café, o maior produtor de cana de açúcar e laranja, já tendo sido o segundo maior produtor de cacau e tendo ocupado a quinta posição mundial deste bem na safra de 2005-2006.

O objetivo do estudo de Maia et al (2008) consiste em conceber uma trajetória possível em torno do desempenho preditivo do nível de preços das commodities cacau, café, cana de açúcar, laranja e soja com base na realização de uma previsão do preço recebido pelos produtores para cada um desses bens por meio do modelo ARIMA. 

METODOLOGIA 

Modelos ARIMA 

Processos estacionários 

Os modelos univariados de séries temporais se baseiam na teoria de que há alto volume de informação numa série de dados e que estes podem oferecer estimativas sobre o comportamento da variável no futuro. O modelo ARIMA especificamente se fundamenta na ideia de que as séries temporais analisadas são formadas por um processo estocástico estacionário. Para o artigo em questão, a classe de processos estacionários que será considerada no estudo é a de estacionariedade fraca. 

Modelo ARIMA

 

 

Maia et al (2008) apresentam as possibilidades de modelos ARIMA, a saber:

 

  • Um modelo autorregressivo de ordem (p) ou processo AR(p) consiste em explicar o comportamento futuro da variável com base em seu comportamento passado, de modo que cada período anterior é representado por um coeficiente .
  • Um processo de médias móveis de primeira ordem ou especificação MA(1) se refere à possibilidade de os efeitos resultantes sobre a variável poderem ser representados como uma função dos distúrbios aleatórios anteriores, assim, a série observada se trata de um somatório do histórico de erros anteriores da variável.
  • Um modelo autorregressivo de médias móveis ou ARMA (p,q) se configura como um modelo mais amplo, composto por uma parte autorregressiva da variável (explicada pelo comportamento anterior da própria variável) e uma parte de médias móveis (explicado pelos distúrbios de períodos passados), sendo que p se refere aos termos autorregressivos (que se refere à ordem de defasagens do termo autorregressivo) e q tange às médias móveis (que se diz respeito á ordem de defasagens do termo de médias móveis).
  • Um modelo ARIMA (p,d,q) ou modelo autorregressivo integrado de médias móveis pode resolver o problema da não estacionariedade de grande parcela das séries econômicas. Para tanto, o número de defasagens d, necessárias para tornar uma série estacionária, define o grau de integração da variável.

 

Além disso, a condição de invertibilidade, segundo a qual , viabiliza que os valores mais distantes do tempo presente tenham força reduzida dentro da regressão comparado aos valores mais recentes.

 

 

O Método de Box-Jenkins

 

O conjunto de premissas propostas pelo método de Box-Jenkins ajuda a encontrar o modelo que melhor represente o comportamento da série temporal a partir de quatro etapas:

 

  1. Identificação:

Consiste em concluir qual processo a série segue (AR, MA, ARMA ou ARIMA), fazendo-se uso dos métodos da função de autocorrelação (FAC) e da função de autocorrelação parcial (FACP) com o objetivo de determinar a ordem dos termos p, d e q.

A FAC apresenta a correlação total entre  e , enquanto a FACP se refere à correlação parcial entre duas variáveis  e , ou seja, é a autocorrelação simples que existe entre elas subtraindo-se a parte linearmente explicada pelas defasagens intermediárias.

 

  1. Estimação:

O objetivo desta etapa é estimar os modelos candidatos selecionados, analisar os modelos e escolher os modelos que poderão ser definitivos com base em dois critérios de seleção:

  • critério da parcimônia para o qual se utiliza os critérios mais aplicados em econometria: AIC (Akaike Information Criterion) e SBC (Schwartz Bayesian Criterion) – o melhor modelo corresponde aquele que apresenta o menor AIC e o menor SBC entre os modelos candidatos;
  • critério de análise dos resíduos da regressão: baseado no ajustamento logrado através da inclusão no modelo de variáveis defasadas adicionais – seleciona-se o modelo que possua o menor Erro Quadrado Médio.

 

  1. Teste de diagnóstico, ou Checagem:

O objetivo desta etapa é checar se o modelo representa de forma apropriada a série de dados em estudo. Pressupõe-se que se o processo é estacionário e ergódico, logo, as séries convergem para os verdadeiros parâmetros da população. Dessa forma, a análise dos resíduos é determinante na seleção final do melhor modelo: se os resíduos forem autocorrelacionados, a dinâmica da série não poderá ser interpretada pelos coeficientes gerados pelo modelo e, portanto, é preciso excluir o modelo que tenha autocorrelação residual. Para isto, são ferramentas úteis as estimativas empíricas da FAC e da FACP.

Então, testes de diagnóstico são utilizados para entender se uma série temporal parece ser não autocorrelacionada, objetivo este que é compreendido pela estatística de Box-Pierce que testa se uma série é ruído branco, sendo sua hipótese nula a afirmação de que a série é ruído branco. Já um aprimoramento deste teste consiste na estatística de Ljung-Box, pois esta apresenta melhores propriedades para amostras finitas do que a estatística de Box-Pierce. Mas o entendimento de ambas é o mesmo: se  para certo nível de significância, rejeita-se a hipótese nula de que os resíduos não são autocorrelacionados, isto é, não rejeita-se a hipótese alternativa de que pelo menos uma autocorrelação  seja estatisticamente diferente de zero, o que implica que o erro não é ruído branco, caso em que deve-se descartar o modelo.

 

  1. Previsão:

Etapa na qual se testa a capacidade do modelo de prever os potenciais valores futuros para a série estudada, sendo que a previsão pode tomar 2 aspectos:

  • ex-ante: usada para prever valores futuros que ainda não aconteceram; ou
  • ex-post: usada para prever valores que já existem dentro da série.

A melhor previsão consistirá naquela que tiver o menor Erro Quadrado Médio. Entretanto, é importante destacar que o modelo ARIMA apenas viabiliza previsões com eficácia para períodos de curto prazo.

 

 

RESULTADOS

 

 

As séries estudadas no artigo de Maia et al (2008) se referem aos preços recebidos pelos produtores e foram obtidas na base de dados do IPEADATA. Todas as séries apresentaram seguidas oscilações que traduzem a instabilidade dos preços nestes mercados e passaram por tratamento estatístico para eliminar influências externas, como inflacionamento e sazonalidade.

As séries tangem às principais commodities agrícolas comercializadas no mercado externo: cacau (em reais para cada 15 kg), café (reais por kg de café em coco), cana de açúcar (reais por tonelada), laranja (reais por caixa com 100 unidades) e soja (reais por kg). O objetivo consistiu em verificar a tendência e periodicidade desses bens, viabilizando descrever o cenário para o setor no decorrer do ano corrente, por meio da estimação dos valores para os últimos 6 meses do ano de 2007.

Foi feito o estudo das funções em nível e foi verificado que as séries não são estacionárias, porém ao fazer o estudo do gráfico em primeira diferença, encontrou-se a existência de estacionariedade, com exceção de alguns pontos divergentes do intervalo de confiança. Apenas a série de soja precisou ser diferenciada em segunda ordem.

A estacionariedade dos resíduos foi testada para checar a estacionariedade das séries: todas têm ruído branco, exceto a série de soja que apresentou ruído branco em segunda diferença. Resultados esses que foram reforçados pelo teste de raiz unitária de Dickey-Fuller que mostrou que as séries são estacionárias em primeira diferença, exceto pela série de soja que se torna estacionária após a segunda defasagem.

Foram encontrados os seguintes valores para o processo ARIMA:

 

 

TABELA 1

Valores de ordem do processo ARIMA

Produto
Ordem AR (p)
Ordem de integração (d)
Ordem MA (q)
Soja
5
2
4
Cacau
1
1
2
Laranja
4
1
2
Cana de açúcar
4
1
4
Café
4
1
2

Fonte: Maia et al (2008, página 15)

 

Em seguida, foram selecionados os modelos que apresentaram menor AIC e SBC para a previsão de cada produto e, na etapa seguinte, buscou-se o modelo que tivesse a melhor previsão com base no menor erro médio e chegou-se às conclusão de que o melhor modelo para soja é o ARIMA (3,2,2); para laranja, o ARIMA (3,1,2); para cacau o ARIMA (1,1,2); para cana de açúcar o ARIMA (4,1,2); e para o café o ARIMA (2,1,1).

Com base nos modelos selecionados, fez-se a previsão para o preço de cada commodity e encontrou-se os seguintes valores:

 

TABELA 2

Valores previstos para as séries estudas

Período
Cacau
Café
Cana de açúcar
Laranja
Soja
Junho/2007
29.785
1.098
20.708
3.027
0.229
Julho/2007
30.156
1.113
20.366
3.010
0.219
Agosto/2007
30.422
1.103
20.467
3.035
0.209
Setembro/2007
30.611
1.090
20.752
3.021
0.197
Outubro/2007
30.747
1.080
20.753
3.022
0.186
Novembro/2007
30.844
1.075
20.391
3.034
0.175
Dezembro/2007
30.913
1.074
20.068
3.017
0.164

Fonte: Maia et al (2008, p. 18)

 

Os valores previstos para o preço da laranja mantêm uma média muito próxima ao último valor observado, conservando-a nas observações futuras. Estes valores podem ser resultado de uma espécie de média apresentada pelo preço futuro em relação aos preços dos períodos passados, que se mostraram muito voláteis ao intercalarem períodos de queda com momentos de alta nos preços.

Os valores futuros previstos para o preço da cana de açúcar mostram uma tendência de queda apresentada pela série original, mas intercalada por uma breve alta dos preços, bastante fiel ao cenário mais recente demonstrado pelos preços, que estão num momento de retração, mas com altas esporádicas nos seus valores ao longo da trajetória.

Os valores previstos para o cacau seguem a linha dos preços recentemente apresentada pela série original; ou seja, uma pequena e suave alta nos preços, não apresentado muita oscilação em relação aos valores originais. Estes valores de certa forma também podem ser vistos como uma média das observações passadas, mas dentro de uma tendência de alta.

Os valores previstos para o café colocaram-se num patamar inferior ao da última observação. Contudo, isto pode ser interpretado como a assimilação do comportamento extremamente volátil do preço deste bem, onde o mesmo apresenta constantes oscilações. O modelo captou estas oscilações na forma de um patamar menor para o nível de preços nos períodos futuros muito próximos.

Assimilando a tendência apresentada nas últimas observações, a história da série de soja mostra quedas acentuadas após períodos de elevação dos preços, o que também é refletido no modelo previsto.

 

 

CONCLUSÃO

 

 

Os resultados encontrados oferecem um instrumento para analisar o mercado dessas commodities. Contudo, as previsões não podem ser tratadas como um fim em si mesmas, mas representam uma forma de propiciar informações para a tomada de decisões com determinados objetivos.

As previsões são de grande relevância para que os agentes do setor agrícola, produtores e investidores, formem suas expectativas acerca do comportamento dos preços das commodities no futuro. Mais que isso, os resultados validaram a tendência descrita pelas variáveis reais, o que revela a eficácia dos modelos univariados em realizar previsões de valores futuros com base no próprio histórico da variável.