Vous êtes sur la page 1sur 89

UNIVERSIDADE FEDERAL DE SERGIPE

PROEE PROGRAMA DE PSGRADUAO


EM ENGENHARIA ELTRICA
DEPARTAMENTO DE ENGENHARIA
ELTRICA

ESTUDO DE TCNICAS DE PREVISO DE


CONSUMO EM SISTEMAS DE DISTRIBUIO DE
GS NATURAL

GUSTAVO LIMA CRUZ

So Cristovo
2012

UNIVERSIDADE FEDERAL DE SERGIPE


PROEE PROGRAMA DE PS-GRADUAO EM
ENGENHARIA ELTRICA
DEPARTAMENTO DE ENGENHARIA ELTRICA

ESTUDO DE TCNICAS DE PREVISO DE


CONSUMO EM SISTEMAS DE DISTRIBUIO DE
GS NATURAL

GUSTAVO LIMA CRUZ

Dissertao de Mestrado apresentada ao


Programa de Ps-Graduao em Engenharia
Eltrica PROEE, da Universidade Federal de
Sergipe, como parte dos requisitos necessrios
obteno do ttulo de Mestre em Engenharia
Eltrica.

Orientadores:
Prof. Dr. Carlos Alberto Villacorta Cardoso
Prof. Dr. Jugurta Rosa Montalvo Filho

SO CRISTOVO-SE BRASIL
DEZEMBRO DE 2012

ESTUDO DE TCNICAS DE PREVISO DE


CONSUMO EM SISTEMAS DE DISTRIBUIO DE
GS NATURAL
GUSTAVO LIMA CRUZ
DISSERTAO SUBMETIDA AO CORPO DOCENTE DO
PROGRAMA DE PS-GRADUAO EM ENGENHARIA ELTRICA
PROEE DA UNIVERSIDADE FEDERAL DE SERGIPE COMO PARTE
DOS REQUISITOS NECESSRIOS PARA A OBTENO DO GRAU
DE MESTRE EM ENGENHARIA ELTRICA.
Aprovado em: _____/_____/_____

_________________________________________
Orientador: Prof. Dr. Carlos Alberto Villacorta Cardoso

_________________________________________
Orientador: Prof. Dr. Jugurta Rosa Montalvo Filho

__________________________________________
Prof. Dr. Pablo Javier Alsina

___________________________________________
Prof. Dr. Elyson dan Nunes Carvalho

SO CRISTOVO-SE BRASIL
DEZEMBRO DE 2012

AGRADECIMENTOS
A minha esposa Elidiane pela pacincia e companheirismo durante toda a
jornada acadmica, no deixando desistir quando me faltavam foras para continuar.
Aos meus filhos Luiz e Elisa pelas horas de descontrao.
Aos meus orientadores Carlos Alberto Villacorta Cardoso e Jugurta Rosa
Montalvo Filho pelas palavras de incentivo e apoio ao longo do desenvolvimento deste
trabalho.
A SERGAS pelo fornecimento dos dados histricos e contribuio para o
desenvolvimento da ferramenta.
Aos meus colegas e amigos pela presena durante esta jornada.

- iii -

Resumo da Dissertao apresentada ao PROEE/UFS como parte dos requisitos


necessrios para a obteno do grau de Mestre (Me.).

ESTUDO DE TCNICAS DE PREVISO DE CONSUMO EM SISTEMAS DE


DISTRIBUIO DE GS NATURAL

Gustavo Lima Cruz

Dezembro/2012

Orientador: Prof. Dr. Carlos Alberto Villacorta Cardoso


Programa: Engenharia Eltrica
A previso de consumo de gs tem fundamental importncia para a
companhia distribuidora de gs natural, uma vez que comum que as empresas
supridoras incluam em seus contratos clusulas que obrigam a concessionria
distribuidora realizar a programao do volume de gs natural a ser retirado, sendo a
mesma submetida aplicao de penalidades caso o volume programado exceda limites
previamente estabelecidos.
Sendo assim, no presente trabalho tem sido estudadas as potencialidades
de utilizao dos modelos de previso baseados em regresses, sries temporais e redes
neurais artificiais na previso de consumo de gs, com o objetivo de aprimorar as
metodologias atualmente utilizadas pela distribuidora de gs na programao diria
realizada junto ao supridor, num cenrio caracterizado pela predominncia de
consumidores industriais com caractersticas diferentes entre si.
Neste contexto, considerando o potencial das tcnicas previso, foram
realizados estudos de previso de consumo em mdio prazo de consumidores dos
segmentos industrial e automotivo. A partir destes estudos foi possvel identificar tipos
de comportamentos particulares, bem como a estratgia de previso mais adequada, seja
utilizando as redes neurais artificiais, sries temporais ou uma combinao de ambas.
Para realizao dos estudos uma ferramenta computacional foi
desenvolvida, a qual oferece as facilidades necessrias para analisar, parametrizar e
validar os mtodos de previso baseado em dados histricos de consumo. Os resultados
obtidos so promissores, pois apresentam condies de contorno prximo dos valores
reais.

- iv -

Abstract of Dissertation presented to PROEE/UFS as a partial fulfillment of the requirements


for the degree of Master.

STUDY OF CONSUMPTION FORECASTING SYSTEMS NATURAL GAS


DISTRIBUTION

Gustavo Lima Cruz

December / 2012

Advisor: Dr. Carlos Alberto Cardoso Villacorta


Program: Electrical Engineering

The forecasting of gas consumption has a fundamental importance for the


natural gas distribution company, since it is common for supply companies include
clauses in their contracts that force the distributor companies to perform the volume
programming of the natural gas to be withdrawn, these same companies are subjected to
the application of penalties if the volume exceeds programmed limits previously
established.
Thus, in the present work has been studied the potentialities to use of
predictive models based on regression, time series and artificial neural networks in
forecasting gas consumption, with the intend to improved the methodologies currently
used by gas distributor in the daily schedule to send to the supplier, in a scenario
characterized by the predominance of industrial consumers with dissimilar
characteristics.
In this context, considering the potential of forecasting techniques, has
been studied the gas consumption forecasting in the medium term of both the industrial
consumers and the automotive segments. From these studies it was possible to identify
particular types of behaviors, and the forecasting strategy most suitable approach using
artificial neural networks, time series or a combination of both.
To perform these studies was developed a computational tool to
analyzing, parameterize and validate methods of forecasting based on historical data
consumption. The results are promising because it presents boundary conditions close to
actual values.

-v-

SUMRIO
1.

INTRODUO ....................................................................................................... 1
1.1
1.2
1.3
1.4
1.5

CADEIA DE ABASTECIMENTO DE GS NATURAL ................................................ 2


O MERCADO DO GS NATURAL .......................................................................... 3
O PROBLEMA DA PREVISO DE CONSUMO......................................................... 4
METODOLOGIA ATUAL ...................................................................................... 5
OBJETIVOS ......................................................................................................... 8

2.

ESTADO DA ARTE ................................................................................................ 9

3.

TCNICAS DE PREVISO ................................................................................ 12


3.1
ANLISE DE REGRESSO.................................................................................. 12
3.1.1 Regresso linear simples ............................................................................. 12
3.1.2 Regresso linear mltipla ............................................................................ 13
3.1.3 Regresso no linear ................................................................................... 13
3.2
ANLISE DE SRIES TEMPORAIS ...................................................................... 13
3.2.1 Rudo branco................................................................................................ 16
3.2.2 Processo estacionrio .................................................................................. 16
3.2.3 Funo de autocorrelao........................................................................... 17
3.2.4 Funo de autocorrelao parcial .............................................................. 18
3.2.5 Modelos de previso..................................................................................... 19
3.3
REDES NEURAIS ARTIFICIAIS ........................................................................... 24
3.3.1 Modelo de neurnio artificial...................................................................... 24
3.3.2 Redes multilayer perceptron ........................................................................ 25
3.3.3 O algoritmo backpropagation ..................................................................... 26

4.

METODOLOGIA.................................................................................................. 30
4.1
4.2
4.3
4.4
4.5

5.

NDICES DE DESEMPENHO ................................................................................ 30


DESCRIO DOS DADOS ................................................................................... 32
PROCEDIMENTOS PARA OS MODELOS DE REGRESSO .................................... 32
PROCEDIMENTOS PARA OS MODELOS DE SRIES TEMPORAIS ........................ 36
PROCEDIMENTOS PARA OS MODELOS DE REDES NEURAIS ARTIFICIAIS ......... 38

RESULTADOS ...................................................................................................... 41
5.1
CONSUMIDOR INDUSTRIAL A .......................................................................... 41
5.1.1 Modelo de regresso .................................................................................... 41
5.1.2 Modelo de srie temporal ............................................................................ 44
5.1.3 Modelo de rede neural Artificial ................................................................. 47
5.1.4 Comparao dos resultados......................................................................... 48
5.2
CONSUMIDOR INDUSTRIAL B ........................................................................... 50
5.2.1 Modelo de regresso .................................................................................... 50
5.2.2 Modelo de srie temporal ............................................................................ 53
- vi -

5.2.3 Modelo de rede neural Artificial ................................................................. 55


5.2.4 Comparao dos resultados......................................................................... 57
5.3
CONSUMIDOR GNV A ..................................................................................... 58
5.3.1 Modelo de regresso .................................................................................... 58
5.3.2 Modelo de srie temporal ............................................................................ 61
5.3.3 Modelo de rede neural artificial .................................................................. 63
5.3.4 Comparao dos resultados......................................................................... 66
6.

CONCLUSO........................................................................................................ 67
6.1

SUGESTES PARA TRABALHOS FUTUROS ........................................................ 68

REFERNCIAS BIBLIOGRFICAS ........................................................................ 69


APNDICE A - FERRAMENTA COMPUTACIONAL .......................................... 72

- vii -

Captulo 1
1. Introduo
O gs natural um combustvel fssil encontrado no subsolo, por
acumulaes em rochas porosas, isoladas do exterior por rochas impermeveis,
associadas ou no a depsitos de petrolferos. Sua composio funo de uma srie de
fatores naturais que determinaram o seu processo de formao e as condies de
acumulao do seu reservatrio de origem [1].
O gs natural encontrado na natureza uma mistura diversificada de
hidrocarbonetos saturados, cujo componente preponderante o Metano e em menores
quantidades, o Propano e o Butano, entre outros [2].
De acordo com a Lei n. 9.578/97 Lei do Petrleo, o gs natural
definido como sendo a poro do petrleo que existe na fase gasosa ou em soluo no
leo, nas condies originais do reservatrio, e que permanece no estado gasoso nas
condies atmosfricas de presso e temperatura.
A composio comercial do gs natural variada e depende da
composio do gs natural bruto, do mercado atendido, do uso final e do produto gs
que se deseja. No mercado Brasileiro, segundo a resoluo da ANP n. 16, de 17 de
junho de 2008, a especificao do gs natural deve seguir o especificado no Quadro 1.1.
Quadro 1.1 Especificao para o Gs Natural Comercializado no Brasil.
[2]

-1-

1.1 Cadeia de abastecimento de gs natural


A cadeia de abastecimento de gs natural pode ser dividida em
basicamente quatro etapas, exemplificadas na Figura 1.1.
Explorao: etapa inicial realizada em duas fases. A primeira fase
a de pesquisa na qual se verifica a existncia de bacias sedimentares de rochas
reservatrias. Caso positivo o resultado da pesquisa, inicia-se a fase de perfurao [2].
Processamento: esta etapa realizada por meio de uma instalao
industrial denominada Unidade de Processamento de Gs Natural (UPGN), cujo
objetivo separar as fraes pesadas ou ricas (propano e hidrocarbonetos pesados)
existentes no gs natural mido ou rico gerando o gs natural seco ou pobre (metano e
etano) e o lquido de gs natural (composto por fraes mais pesadas que o propano).
[2].
Transporte: o transporte do gs natural realizado por meio de
dutos. O gasoduto uma rede de distribuio que leva o gs natural das fontes
produtoras at os centros consumidores e tem a capacidade de transportar grandes
volumes, em funo dos grandes dimetros de tubulao e a alta presso na qual opera e
somente se aproxima das cidades para entregar gs s companhias distribuidoras,
fazendo parte de um sistema integrado de transporte de gs natural [2].
Distribuio: o gs comercializado por meio de contratos de
fornecimento com as companhias distribuidoras de cada estado, detentoras da concesso
de distribuio. Nas estaes de transferncia de custdia (city gates) ocorre a
transferncia de propriedade entre a transportadora e a companhia distribuidora, alm da
regulagem de presso e da medio dos volumes transferidos [2].

[2].

Figura 1.1 Cadeia de Abastecimento de Gs Natural.


-2-

1.2 O mercado do gs natural


O gs natural tem um amplo espectro de aplicaes. Dentre elas pode-se
destacar a sua utilizao como combustvel industrial, comercial, domiciliar e
residencial, e na recuperao secundria de petrleo em campos petrolferos, atravs de
sua reinjeo.
Na indstria petroqumica, o gs natural utilizado como matria-prima
para produo de plsticos, tintas, fibras sintticas e borracha.
O uso do gs natural em residncias, seja para coco, seja para
aquecimento de gua, alm da segurana e praticidade, tem a vantagem de substituir o
gs liquefeito de petrleo, mais popularmente conhecido com GLP ou gs de cozinha
(derivado de petrleo importado pelo Brasil), que exige complexa infraestrutura de
transporte e armazenamento.
Outra forma que vem ganhando destaque a utilizao de gs natural
como combustvel na gerao de eletricidade, seja em usinas termeltricas, seja em
unidades industriais, instalaes comerciais e de servios, em regime de cogerao
(produo combinada de vapor e eletricidade) [1].

1.2.1 Reservas brasileiras de gs natural


A Agncia Nacional do Petrleo, Gs Natural e Biocombustveis (ANP)
divulgou nota retificando os valores das reservas provadas de petrleo e gs natural do
Brasil em 2010.
As reservas provadas de gs natural tiveram aumento de 15,23% na
comparao entre 2009 e 2010, passando de 367.095 milhes de metros cbicos para
423.003 milhes de metros cbicos. Este crescimento inferior apenas comparado
como registrado em 2004 em relao a 2003, que foi de 32,91%. No que diz respeito s
reservas totais de gs natural, no mesmo perodo, a elevao foi de 37,11%, de 601.518
milhes de metros cbicos para 824.723 milhes de metros cbicos, foi a maior desde
2004, quando o aumento foi de 41,68% frente ao ano anterior [3].
Os dados de 2010 incluem tambm as reservas referentes ao pr-sal da
Bacia de Santos (antigas reas exploratrias de Tupi e Iracema no Bloco BM-S-11),
descobertas nos campos de Barracuda, Caratinga, Marlim, Marlim Leste e Pampo na
Bacia de Campos, alm de projetos de aumento de recuperao de petrleo nos campos
de Albacora Leste, Maromba, Marimb, Marlim Sul, Marlim Leste e Roncador na Bacia
de Campos e na concesso de Leste de Urucu na Bacia do Solimes [3].
Na Figura 1.2 possvel observar um aumento de 0,4% a 10,3% de
consumo de gs no perodo que vai de 1973 at 2010, o que demonstra no apenas um
crescimento absoluto, mas tambm uma maior participao desta fonte de energia na
matriz energtica nacional. Por outro lado, na Figura 1.3 possvel observar a
-3-

participao do gs como fonte de energia no Brasil, representado por 10,3% (2010),


ainda baixa quando comparada com a mdia de consumo mundial de gs natural, que
atinge 23,4%, segundo a OECD (Organisation for Economic Cooperation and
Development).

[Fonte: Ministrio de Minas e Energia, Balano Energtico Nacional, 2010]

Figura 1.2 Comparativo da matriz energtica brasileira de 1973 e de 2010.

[Fonte: Ministrio de Minas e Energia, Balano Energtico Nacional, 2010]

Figura 1.3 Matriz energtica do Brasil e do mundo

1.3 O problema da previso de consumo


Com o aumento da participao do gs natural na matriz energtica,
inmeros so os desafios que se impem s pesquisas no campo das previses de
consumo, uma vez que a produo do gs natural esta diretamente ligada ao consumo,
ou seja, o supridor ajusta a sua capacidade produtiva em funo da disponibilidade dos
dutos de transporte e das demandas dos centros consumidores.
-4-

O supridor, figura responsvel por suprir a demanda de gs natural das


distribuidoras locais, inclui em seus contratos clusula que obriga a concessionria
realizar a programao de volume a ser retirado de gs natural, sendo a mesma
submetida aplicao de penalidades caso o volume programado exceda limites
previamente estabelecidos [4].
Motivados pela necessidade de no ser penalizado, as distribuidoras de
gs natural tm tratado o assunto com muita seriedade, sendo para rea de Medio um
grande desafio, pois neste problema procura-se determinar o volume de gs a ser
consumido em cada ponto da rede com certa antecedncia, dentro da menor margem de
erro possvel.
Semelhante aos sistemas de distribuio de energia eltrica, onde o
desafio a previso de carga, em redes de distribuio de gs natural o problema reside
na programao de volume, onde o grande desafio tentar antecipar com a menor
margem de erro possvel a variabilidade da curva de demanda, devido s diferentes
condies de operao encontradas no diversos segmentos de consumo, e na dificuldade
de se estabelecer um modelo bem definido do comportamento da carga dado
irregularidade no seu aspecto [5].
Devido a essas irregularidades, a utilizao de uma ferramenta capaz de
identificar todas essas sinuosidades da carga seria de grande ajuda no planejamento e
determinao dos volumes demandados nas redes de distribuio e consequentemente
na reduo de penalidades aplicada as companhias de distribuio de gs natural, em
funo de desvios acentuados.

1.4 Metodologia atual


A companhia de distribuio em estudo SERGAS atende,
majoritariamente, clientes industriais, com uma parcela equivalente a 56,4% do volume
distribudo, conforme demonstrado na Figura 1.4, este conjunto abrange diferentes tipos
de indstrias, como por exemplo, fabricantes de bebidas, cermicas, processamento de
alimentos, txtil e minerao. Adicionalmente, os postos de gs natural veicular
constituem aproximadamente 40,1% deste mesmo volume. Em forma minoritria e sem
muita expressividade encontram-se os clientes residenciais e comerciais. Em cidades
com clima temperado, como por exemplo, cidades localizadas na Europa, o consumo
residencial teria uma expressividade maior, uma vez que o gs natural utilizado para
sistemas de calefao.

-5-

Figura 1.4. Consumo de gs natural por segmento


Com o intuito de realizar a programao de volumes a ser retirado pelos
consumidores, ou seja, a previso de consumo de gs natural foi desenvolvida pela
companhia uma planilha eletrnica que separa os consumidores em dois grandes
segmentos: Consumidores industriais e automotivos (GNV Gs Natural Veicular). O
mtodo matemtico aplicado em cada segmento diferenciado.
Para os consumidores automotivos, que representam aproximadamente
40,1% do consumo de gs natural, foi ajustada uma funo polinomial de 3 grau ( 1 ), e
aplicado um ndice de correo em funo do dia da semana, conforme demonstrado na
Tabela 1.1.
  14,0531   560,5443   272,854  1825,371

em que x, representa o horrio para o qual deseja-se realizar a previso;  representa o


valor estimado de consumo para um dado horrio; Ic representa o ndice de correo,
conforme Tabela 1.1.
Tabela 1.1 ndices de Correo para Consumidores Automotivos (GNV).
DOMINGO
0,6

FERIADOS
0,6

SEXTAFEIRA
0,95

SBADO
0,90

DEMAIS
DIAS
0,95

Outro aspecto importante esta relacionado forma como os dados


disponveis so trabalhados. Neste segmento no realizada a previso de consumo por
consumidor e sim de forma coletiva ou aglutinada, ou seja, uma nica previso para
todo o segmento.
Para os consumidores industriais, que representam aproximadamente
56,4% do consumo de gs natural, foi ajustada uma equao linear simples baseada em
-6-

(1)

dois pontos de consumo medidos diariamente, geralmente s 08:00 e 11:00. A previso


de consumo feita de forma individualizada, conforme exemplificado na Figura 1.5,
onde a linha pontilhada representa a reta prevista e a linha cheia a reta realizada.

Figura 1.5 Previso de Consumo para o Segmento Industrial (Prevista x


Realizada)
A previso de consumo a ser informada ao supridor uma composio
dos consumos previstos nos segmentos industrial, automotivo, comercial e residencial,
sendo este dois ltimos includos no equacionamento por intermdio de uma constante e
representam apenas 3,41% do consumo de gs natural.
A eficincia da metodologia avaliada com ajuda do grfico apresentado
na Figura 1.6, o qual evidencia a fragilidade do mtodo, quando observados os
resultados obtidos de forma individualizada, com diferenas entre o volume previsto e o
real na ordem dos 40%.

Figura 1.6 Avaliao da Eficincia da Metodologia

-7-

Outro ponto negativo da metodologia aplicada esta na aglutinao dos


consumidores automotivos, pois situaes individuais como desabastecimento de uma
regio no so observadas para realizao da previso de consumo.

1.5 Objetivos
O objetivo principal deste trabalho estudar as potencialidades das
tcnicas de previso, sejam elas, regresso, sries temporais, redes neurais ou as
mesmas de forma associada na previso de consumo de gs natural, num cenrio
caracterizado pela predominncia de grandes consumidores industriais, diferentes entre
si, com vistas a melhorar os atuais mtodos de previso utilizados pela companhia
distribuidora em estudo.
Como objetivos especficos pode-se mencionar:

Desenvolver um modelo quantitativo utilizando como referncias


os dados disponibilizados pela companhia distribuidora de gs natural do estado de
Sergipe - SERGAS do perodo de 01 de janeiro de 2011 a 31 de agosto de 2011. Os
dados so tomados em base horria e correspondem s medies de volume em metros
cbicos (m).

Desenvolver uma ferramenta integrada que permita: mudar as


parametrizaes das tcnicas de previso, bem como definir diferentes perodos de
treinamento e validao, executar e avaliar o desempenho das tcnicas de previso
utilizadas.

-8-

Captulo 2
2. Estado da arte
Em 1994 AZZAM-UL-ASAR et al [5] publicaram o artigo denominado
A Specification of Neural Network Applications in the Load Forecasting Problem.
Neste artigo os autores investigam a eficcia da Rede Neural Artificial (RNA) para a
previso de curto prazo de carga em sistemas eltricos de potncia. So demonstrados o
processo de aprendizagem e a capacidade de uma rede neural na previso do pico dirio
de carga com a utilizao de exemplos. Diferentes abordagens para normalizao dos
dados e padres de entrada so utilizadas para explorar a correlao entre a carga
histrica, temperaturas e os padres de carga esperados. As redes foram treinadas com
dados reais de carga usando um algoritmo de backpropagation. As perspectivas para a
aplicao de uma soluo combinada utilizando redes neurais artificiais e sistemas
especialistas, chamada de rede hbrida, tambm so discutidas. Sendo estas apontadas
como uma soluo mais completa para o problema de previso em face de utilizao de
um sistema simples.
Em 1995 BROWN et al [6] publicaram o artigo denominado
Development of Artificial Neural Network Models to Predict Daily Gas Consumption.
Modelos Redes Neurais Artificiais (RNA) para predizer o consumo dirio de gs natural
so o tema deste artigo. A metodologia baseada no conhecimento da rede e na intuio
dos controladores para previso de consumo discutida. Resultados mostram que a
Rede Neural Artificial pode reduzir o erro de previso (RMSE Root Mean Square
Error) em mais de metade, quando comparado com os modelos de regresso linear e
que quando comparados com previses feitas pelos controladores da companhia de gs,
os erros de previso da Rede Neural Artificial so 20% a 30% menores.
Em 1995 MOHAMMED et al [7] publicaram no IEEE o artigo
denominado Practical Experiences with An Adaptive Neural Network Short-Term Load
Forecasting System. Neste artigo apresentado um sistema baseado em uma rede neural
adaptativa para previso de carga eltrica em curto prazo. O sistema foi desenvolvido e
implementado para a Florida Power Company and Light (FPL). Experincias prticas
com o sistema so discutidas, como a capacidade de previso de carga com um tempo
de espera de uma hora a sete dias. O mecanismo adaptativo usado para treinar as redes
neurais quando o sistema esta on-line. Os resultados indicam que o sistema de previso
de carga apresenta previses robustas e mais precisas, permitindo uma maior
-9-

adaptabilidade s bruscas mudanas climticas em comparao com mtodos


estatsticos.
Em 1999 KHOTANZAD et al [8] publicaram o artigo denominado
Natural Gas Load Forecasting with Combination of Adaptive Neural Networks. O foco
deste trabalho a combinao de redes neurais artificiais (RNA) para previso de
consumo dirio de gs natural realizado pelas concessionrias de gs. Um sistema de
duas fases proposto. A primeira fase com trs previsores baseados em redes neurais
artificiais, sendo o primeiro um previsor multicamada feedforward treinado com o
algoritmo backpropagation, o segundo outro multicamada feedforward treinado com o
algoritmo levenberg-Marquad, e o terceiro uma camada de rede de ligao funcional.
Estes trs previsores separados so combinadas de forma no linear na segunda etapa
usando uma ligao funcional RNA. Um esquema introduzido para fazer a adaptao
das RNAs, com os seus pesos mudando a cada fase de previso. O desempenho
testado com dados reais de quatro distribuidoras de gs durante vrios meses. Os
resultados mostram que a abordagem proposta com a combinao de previsores no
resultar em previses mais precisas em comparao com o uso de um nico previsor.
Em 2001 PEHARDA et al [9] publicaram o artigo denominado Short
term hourly forecasting of gas consumption using neural networks. Este trabalho
apresenta um modelo baseado em rede neural para previso de consumo de gs nos
segmentos residenciais e comerciais. Neste trabalho foi proposta uma rede neural
feedforward com funo de ativao sigmoide, uma camada escondida e treinada com o
algoritmo backpropagation. O modelo foi validado com dados reais de uma rea de
distribuio que cobrem 7% do consumo total, na Crocia, regio onde esto
concentrados os consumidores residenciais e comerciais. Segundo os autores, o mtodo
proposto provou ser muito simples e vivel. O erro de previso foi pequeno, embora as
condies climticas estivessem instveis e excepcionalmente quentes para a poca do
ano. O desvio padro das previses pequena. O modelo unificado para todos os dias
da semana foi bem ajustado e o erro para o fim de semana foi semelhante ao erro para
todos os outros dias. Durante o treinamento, a excluso de alguns dados demonstrou ser
bastante til, porque eles impediram a generalizao. O mtodo tambm pode ser
modificado para servir para outras necessidades de previso de curto prazo.
Em 2003 VIET et al [10] publicaram o artigo denominado Neural And
Fuzzy Neural Networks For Natural Gas Consumption Prediction. Neste trabalho vrias
abordagens para a previso de consumo de gs natural com redes neurais e redes fuzzy
neurais para uma determinada regio da Polnia so analisadas e testadas. Estratgias de
previso testadas incluem: um nico mdulo de rede neural, a combinao de trs
mdulos neurais, mtodo baseado no agrupamento por temperatura e aplicao de redes
neurais nebulosas. Os resultados indicam a superioridade do mtodo baseado no
agrupamento por temperatura em face s abordagens modulares e fuzzy neurais. Uma
das questes interessantes observada pelo autor no artigo o desempenho relativamente
bom dos mtodos testados, no caso de uma predio de longo prazo (quatro semanas)
em relao predio mdio prazo (uma semana). Geralmente, os resultados so
- 10 -

significativamente melhores do que os obtidos por meio de mtodos estatsticos,


atualmente utilizados na companhia distribuidora de gs.
Em 2008 KIZILASLAN et al [11] publicaram o artigo denominado
Comparison Neural Networks Models for Short Term Forecasting of Natural Gas
Consumption in Istanbul cujo objetivo identificar o modelo de rede neural artificial
mais adequado para previso de consumo dirio de gs natural, considerado pelo autor
importante, tanto para as distribuidoras quanto para os consumidores. Neste estudo
tambm foram analisados os fatores que influenciam o consumo e os resultados
aplicados na rede neural artificial. As razes para escolha desta metodologia se deve a
sua capacidade de modelar a relao no linear existente nos dados histricos com a
utilizao de mais de uma varivel ao mesmo tempo.
Em 2010 XU et al [12] publicaram o artigo denominado Forecasting
Chinas natural gas consumption based on a combination model. Neste estudo, foram
utilizadas curva polinomial e Projeo Combinada de Mdia Mvel para estimar o
consumo de gs natural na China no perodo de 2009-2015. O novo modelo proposto
apresentou resultados mais confiveis e precisos quando comparado a outras
metodologias, tais como: modelo auto-regressivo integrado e de mdia mvel
(ARIMA), modelo de correo de erros (ECM), modelo de sries temporais e regresso
por mnimos quadrados parcial (PLSR), seu erro percentual mdio absoluto (MAPE)
menor do que os de todos os modelos anteriores dentro da faixa investigada.
Em 2012 ABREU [13] et al publicaram o artigo denominado
Metodologia hbrida utilizando os modelos ARIMA e redes neurais artificiais para
previso de cargas eltricas. O objetivo deste trabalho foi desenvolver um modelo
hbrido utilizando os modelos ARIMA de Box e Jenkins e Redes Neurais Artificiais
com treinamento realizado pelo algoritmo de Levenberg-Marquartd. Este modelo foi
utilizado com a finalidade de melhorar a preciso dos resultados com relao previso
de cargas eltricas em curto prazo. Os resultados obtidos atravs da metodologia
proposta, modelo hbrido de regresso com redes neurais artificiais, foram comparados
com outros trabalhos da literatura. A autora concluiu que o modelo proposto foi capaz
de realizar previses para perodos distintos que tambm envolveram dias atpicos e
finais de semana com confiana e alto desempenho.

- 11 -

Captulo 3
3. Tcnicas de previso
Determinar uma relao entre o consumo de gs e os fatores que
influenciam o seu comportamento trata-se de um processo bastante complexo. No
segmento industrial fatores como condies climticas (perodo chuvoso e perodo
seco), finais de semana e feriados podem ser determinantes para o planejamento e
controle da produo [4]. O mesmo ocorre para o segmento de gs natural veicular, pois
tais fatores influenciam na demanda por transporte automotivo e consequentemente o
consumo de gs natural.
Neste aspecto, diversas abordagens tm sido aplicadas, tais como
regresso, processos estocsticos, redes neurais artificiais e sistemas especialistas [14].
No campo da previso de consumo, outra dificuldade a ser vencida a de
estimar e ajustar os parmetros do modelo, que dependem de dados histricos, que por
sua vez podem tornar-se obsoletos ou no refletir as variaes do consumo.

3.1 Anlise de regresso


A anlise de regresso definida como sendo a tcnica na qual se deseja
quantificar a relao de dependncia entre duas ou mais variveis [16]. Com este
objetivo pode-se modelar esta relao atravs de regresses lineares simples, lineares
mltiplas e no lineares [17].

3.1.1 Regresso linear simples


A existncia de uma relao linear implcita entre duas variveis, sendo
uma independente Y e outra dependente X, pode ser modelada atravs de uma regresso
linear simples [16].
A frmula dada por [17]:
    

(2)

- 12 -

Em que e so conhecidos como coeficientes da regresso e


especificam, respectivamente, o ponto onde a reta intercepta o eixo Y e a inclinao da
reta. Para estimao dos coeficientes pode-se utilizar o mtodo dos mnimos quadrados.

3.1.2 Regresso linear mltipla


A extenso de uma regresso linear simples, onde existe nica varivel
dependente Y e mais de uma varivel independente X1, X2,.., Xn, chamada de regresso
linear mltipla, descrita como [18]:
            

 3 )

em que b0 uma constante, e representa o valor de Y quando todos os valores de Xi so


zero e bi o coeficiente de regresso para cada X. Estabelece a quantia que Y varia com
cada mudana unitria de Xi.
Pode-se inferir que, assim como na regresso linear simples, a resposta
da regresso deve ser contnua, ou seja, no se pode utilizar regresso linear para
predizer uma varivel ordinal.

3.1.3 Regresso no linear


O modelo linear mltiplo pode ser transformado, atravs da adio de
termos polinomiais, em um regressor polinomial [17].
Outros modelos de regresso no linear, tais como logartmica,
exponencial e potncia, podem ser modelados com a utilizao de regressores lineares,
para isso necessrio definir as transformaes de variveis, aplic-las aos dados
existentes, obter a regresso linear correspondente e, por fim, substituir as variveis
originais.
Alguns modelos de regresso no podem ser convertidos em uma funo
linear. Nestes casos, por intermdio de clculos adicionais sobre frmulas mais
complexas, pode ser possvel obter as estimativas de erro quadrtico mnimo [17].

3.2 Anlise de sries temporais


Um conjunto de valores passveis de ordenao cronolgica
denominado Srie Temporal [19], em outros termos, pode-se defini-la uma como sendo
um conjunto de observaes de uma determinada varivel, geralmente distribudas de
maneira equidistante no tempo, e que possuem como caracterstica central a presena de
uma dependncia serial entre elas [20].
A srie temporal, definida como um conjunto de observaes de uma
determinada varivel, denotada por Zt, onde t = {1, 2, 3, 4, ..., n} so os intervalos de
- 13 -

amostragem, e (Zt) a funo densidade de probabilidade para cada t, conforme


mostrado na Figura 3.1 [20].

Figura 3.1 Srie Temporal e Caractersticas de Distribuio de Probabilidade


Tpica
Na Figura 3.1 observa-se que a variao no pontual, mas sim segue
uma curva de probabilidade para cada tempo, sendo que para cada tempo t existe uma
distribuio de probabilidade que pode no ser necessariamente a mesma para os
demais.
So exemplos de sries temporais pedidos, demandas, valores dirios dos
preos de aes de uma empresa na bolsa de valores. A Figura 3.2 exemplifica uma
srie temporal que representa o consumo horrio de gs natural em um Posto de
combustvel.

Figura 3.2 Consumo Horrio de Gs Natural


Podendo tambm ser vista como a realizao de um processo estocstico,
que definido como uma sequncia de observaes regidas por leis probabilsticas. A
srie temporal pode ser considerada como uma amostra de um determinado processo
estocstico [20].
O principal objetivo da modelagem das sries temporais realizar
previses, sendo assim, seu estudo trabalha o comportamento dos dados no passado e
presente para que estes forneam uma ideia das possveis variaes no futuro [21].
- 14 -

O objeto fundamental da anlise de uma srie temporal determinar suas


componentes bsicas buscando identificar um padro de comportamento da srie que
possibilite fazer previses, podendo ser traduzido em [22]:

Modelagem do fenmeno sob considerao;


Concluses em termos estatsticos;
Avaliao da adequao do modelo para previso.

Para iniciar a anlise de qualquer srie temporal necessria a elaborao


de um grfico, a fim de obter uma viso qualitativa geral do seu comportamento [23].
Entretanto esta ao apenas um direcionador, sendo necessrias anlises estatsticas
para uma concluso mais verdadeira sobre o comportamento da srie.
As curvas obtidas pelas sries temporais podem conter [24]:

Tendncia: aponta a direo dos dados estudados. Sua principal


caracterstica o movimento suave num perodo longo de tempo, direcionando os dados
de modo constante, crescente ou decrescente. Pode-se dizer que existe um padro de
tendncia quando h um aumento ou diminuio, em longo prazo, do valor mdio dos
dados [22].

Sazonalidades: flutuaes que se repetem periodicamente,


acompanhando um padro temporal (relacionadas ao fator tempo), por exemplo
influncias climticas, ou ainda mudanas ou variaes cclicas de curto prazo bastante
parecidas com os fenmenos cclicos, com a diferena de que estes so caracterizados
por variaes que oscilam em torno da tendncia a intervalos aproximadamente
regulares de tempo e em longo prazo.

Variaes irregulares: alteraes na demanda passada resultante


de fatores excepcionais, como greves ou catstrofes climticas, que no podem ser
previstos e, portanto, includos no modelo [24].

Aleatoriedade (ou Erro): uma sequncia de variveis aleatrias


independentes e identicamente distribudas, geralmente com mdia zero e varincia
constante igual a 2 caracterizadas por sua durao curta e intensidade varivel [25].
Outra forma de classificar as sries temporais baseando-se no nmero
de sries temporais envolvidas na modelagem. Esta classificao divide-se em [22]:

Modelos Univariados: mtodos que se baseiam em uma nica


srie histrica, ou seja, a srie temporal explicada (prevista) apenas por seus valores
passados. Este modelo ser utilizado no presente trabalho.

Modelos Multivariados ou Causais: mtodos que modelam


simultaneamente duas ou mais sries temporais permitindo relaes de interdependncia
e causalidade, mas sem qualquer exigncia com relao direo da causalidade entre
elas. A srie temporal explicada (prevista) pelos seus valores passados e tambm pelos
valores passados de outras variveis.

- 15 -

Sries temporais podem ser descritas com a utilizao de modelos


estatsticos, que podem ser classificados em duas classes, segundo o nmero de
parmetros envolvidos [26].

Modelos paramtricos: nmero de parmetros finito. Os modelos


mais comumente usados so os modelos AR, ARMA, ARIMA e os modelos no
lineares.

Modelos no paramtricos: nmero infinito de parmetros. Podem


ser exemplificados pela funo de auto-covarincia (ou autocorrelao) e modelos de
redes neurais.

3.2.1 Rudo branco


O rudo branco caracteriza-se por possuir mdia zero, varincia constante
e ser no autocorrelacionado. Ao definir-se um modelo de regresso, conveniente
assumir que o erro seja um rudo branco [27].
2

A incluso de uma perturbao (rudo branco) no modelo de regresso


necessria na anlise por trs importantes razes: [28].

Generalizar e simplificar o modelo de regresso. Como exemplo


pode-se citar os processos econmicos que, geralmente, incluem somente os termos
determinsticos de primeira ordem para o estudo, significando que outras variveis com
efeitos de segunda ordem ou superiores no passam a compor o termo erro.

Considerar o efeito de possveis erros de medida da varivel


dependente ou da varivel a ser explicada;

Captar o fator humano que difira de forma aleatria sob


circunstncias idnticas.
O ajuste adequado do modelo pode ser observado quando a estrutura
residual um rudo branco, isto , o erro uma varivel aleatria independente e
identicamente distribuda, com distribuio normal, mdia zero e desvio padro N(0;) [29].

3.2.2 Processo estacionrio


Define-se Processo Estacionrio como sendo um processo estocstico no
qual as caractersticas estatsticas no se alteram com o decorrer do tempo, ou seja, os
dados flutuam ao redor de uma mdia constante, conforme apresentado na Figura 3.3
[22].

Figura 3.3. Processo estacionrio.


- 16 -

Em termos formais, a distribuio de probabilidade conjunta de um


processo estacionrio nos instantes t1, t2, ... , tm mesma que a distribuio nos instantes
t1+k , t2+k , ... , tm+k para qualquer k, ou seja, um deslocamento de k unidades de tempo
no afetar a distribuio de probabilidade conjunta.
Um das suposies bsicas feitas na anlise de sries temporais que o
processo estocstico gerador dos dados seja um processo estacionrio [30].

3.2.3 Funo de autocorrelao


Uma srie temporal Zt pode ser representada estatisticamente pelas
seguintes equaes: [20].
Mdia ou valor esperado: z = E[Zt]
Varincia: 2 = E[(Zt - )2]
Autocovarincia: k = E [(Zt - z) (Zt+k - z)]

(4)
(5)
(6)

A autocovarincia: a medida de dependncia entre duas observaes


separadas por k intervalos de tempo.
Autocorrelao:

"#$% &'$%() &'*

+"#$% &', *"#$%() &', *

(7)

A autocorrelao possui a finalidade de medir a intensidade com que um


valor observado no tempo t influenciado por aquele observado no tempo tk.
A funo de autocorrelao (Autocorrelation Function ACF), que nada
mais do que a representao grfica da autocorrelao em funo do deslocamento k,
apresentada na Figura 3.4, pode ser utilizada para identificar a ordem de um modelo
auto-regressivo, mas no suficiente, pois todos os modelos auto regressivos tm uma
ACF que decresce exponencialmente e, portanto apenas o correlograma no traz
informao sobre o grau do polinmio auto regressivo.
A observao da forma da funo de autocorrelao pode definir o
modelo a ser utilizado para o ajuste atravs da modelagem Box e Jenkins, alm de
determinar sazonalidade na srie temporal e o perodo de ocorrncia [26].

Figura 3.4. Autocorrelao da Srie Temporal


Por definio, autocorrelao a correlao existente entre dois valores
da mesma varivel nos instantes xi e xi+k. Em que k chamado de atraso (lag) [31].
- 17 -

O valor de k pode variar de 1 a 1 e quanto mais prximo de 1 ou de 1


estiver, maior ser a correlao existente entre a reta e os dados [24].

3.2.4 Funo de autocorrelao parcial


A funo de autocorrelao parcial (Partial Autocorrelation Function
PACF) mede a correlao entre duas amostras xt e xt+k, separadas por um intervalo de
tempo k, excluindo a dependncia dos valores intermedirios wt+1, wt+2, ... , wt+k-1 [31].
-

1


!&

!&

!&

!



!&
0 . - ! 0  - 0

!!
1
!
!&

Resolvendo a ( 8 ) para k = 1, 2, 3, ... , tem-se:


 

 
 

5
5




( 8 )
( 9 )
( 10 )

5


( 11 )

5

Onde !! representa a Funo de Autocorrelao parcial para o atraso k.

Figura 3.5. Autocorrelao Parcial da Srie Temporal


Por definio, autocorrelao parcial, apresentada na Figura 3.5, a
correlao entre duas amostras xt e xt+k, separadas por um intervalo de tempo k,
excluindo a dependncia dos valores intermedirios wt+1, wt+2, ... , wt+k-1. Em que k
chamado de atraso (lag) [31].

O valor de !! pode variar de 1 a 1 e quanto mais prximo de -1 ou de


1 estiver, maior ser a correlao parcial existente entre a reta e os dados [31].

- 18 -

3.2.5 Modelos de previso


A previso de demanda utilizando mtodos quantitativos pode ser feita
atravs de vrios modelos de regresso. O emprego de cada modelo depende
basicamente do comportamento da srie temporal que se deseja analisar [32].
Modelo auto-regressivo (AR)
Quando uma varivel dependente xt em um dado momento t depende
apenas do seu prprio valor no perodo anterior (t-1) e de um termo aleatrio (rudo
branco), t, no correlacionado com xt, com mdia zero e varincia constante diz-se que
esta varivel segue um processo auto-regressivo de primeira ordem [28].
Se uma observao xt gerada pela mdia ponderada de somente as p
primeiras observaes prximas anteriores da varivel acrescida de um erro aleatrio t,
ento ela pode ser modelada por um processo AR(p), dado por [28]:

em que:

6  7 . 6&  7 . 6&   78 . 6&8  9  :6

 12 )

:6 = 6 ;6

( 13 )

;6 a estimativa de xt, um valor constante e i so os coeficientes constantes autoregressivos que descrevem como um valor corrente xt relaciona-se com valores passados
xt-1, xt-2, ... , xt-p.
A mdia de um AR(p) dada pelo valor estimado E[xt] [28]:
<#6 * 

9
= =
1 7 7 78 )

( 14 )

Se o processo estacionrio, a mdia constante.


A condio necessria e no suficiente de estacionariedade
representada por:
7 + 7 + + 78 < 1

( 15 )

O modelo auto-regressivo de ordem 1, indicado por AR(1), verso mais


simples de um modelo AR, aquele em que xt depende somente de xt-1, de t e de uma
constante [33].

6  7. 6&  9  :6
 16 )
2
2
em que um parmetro a ser estimado e E[t] = 0; E[t ] = ; e E[t s] = 0; para t s.
Modelo de mdias mveis (MA)
Quando uma observao xt gerada pela mdia ponderada do valor
presente e dos q primeiros valores passados de um processo de rudo branco t mais a
- 19 -

mdia , ento ela pode ser modelada por um processo MA (Moving Average) (q), dado
por [28]:
6  =  :6  ? . :6&  ? . :6&   ?@ . :6&@

 17 )

em que :6 = 6 ;6 o erro aleatrio ou rudo branco, ;6 a estimativa de xt, i so


os coeficientes de mdia mvel que descrevem como um valor corrente xt relaciona-se
com valores passados xt-1, xt-2, ... , xt-q.
A condio necessria e no suficiente de estacionariedade
representada por [28]:
? + ? + + ?@ < 1

( 18 )

Um MA(q) com q finito ser sempre estacionrio. O modelo de mdias


mveis de primeira ordem, MA(1), dado por [33]:
6 = = + :6 ? :6&

( 19 )

De forma geral, a mdia mvel MA(q) usa um nmero q predeterminado


de perodos passados, normalmente os mais recentes, para gerar sua previso. A cada
novo perodo de previso o dado mais antigo substitudo pelo mais recente [24].
Modelo auto-regressivo de mdia mvel (ARMA)
Quando
o
processo
estacionrio
apresenta
caractersticas
simultaneamente de um processo AR e de um processo MA, ento ele pode ser
modelado por um processo misto ARMA, descrito por seus p valores passados e pelos q
rudos brancos correntes e passados, dados por [33]:
6 = 7 . 6& + + 78 . 6&8 + 9 + :6 ? . :6&
?@ . :6&@

( 20 )

A mdia dada pela parcela do processo AR.


As condies de estacionariedade tambm so dadas pela parcela do
processo AR.
O modelo ARMA (1,1) a especificao mais simples que um processo
dessa natureza pode apresentar [28]:
6 = 7 . 6& + 9 + :6 ? . :6&

( 21 )

Na prtica, os valores de p e q so geralmente menores que 2 para sries


temporais estacionrias [31]. A condio de estacionariedade estabelecida para os
processos AR(p) e MA(q) se mantm nos modelos ARMA (p, q).

- 20 -

Um processo estocstico estacionrio, ou seja, um processo que possui


mdia, varincia e autocorrelao constantes em relao ao tempo, pode ser melhor
representado por um modelo auto-regressivo e/ou mdias mveis ARMA(p,q) [20].
Modelo auto-regressivo integrado e de mdia mvel (ARIMA)
Caso geral dos modelos propostos por Box et al [31], o modelo ARIMA
apropriado para descrever sries no estacionrias, ou seja, sries que no possuem
mdia constante no perodo de anlise, nas quais os parmetros quase sempre so
pequenos e que, na prtica, geralmente apresentam tendncia e/ou sazonalidade [29].
Quando srie original dos dados no estacionria, ser necessria
diferenci-la a d vezes at obter uma srie estacionria (mdia e varincia constantes no
tempo). Posteriormente, a srie obtida pode ser modelada por um processo ARMA(p,q)
[28].
O modelo ARIMA considera a tendncia da srie temporal, tem ordem
(p,d,q) e pode ser representado por [29]:
 22 )

7ABC . 6  ?A. :6

onde: C  (1 A)C , 7(A) = 1 7 A 7 A  78 A 8 o polinmio autoregressivo de ordem p; ?(A) = 1 ? A ? A  ?@ A @ o polinmio de mdias


mveis de ordem q; B o operador de retardo, tal que Bj.xt = xt-j e d o nmero de
diferenas necessrias para retirar a tendncia da srie e transform-la em estacionria.
A metodologia para se prever uma srie temporal atravs dos modelos
ARIMA consiste de quatro etapas: identificao, estimativa, checagem e previso [34].
A etapa de identificao consiste em descobrir os valores apropriados de
p, d e q dentre as vrias verses dos modelos de Box e Jenkins, sejam eles sazonais ou
no, que melhor descrevem o comportamento da srie.
O primeiro parmetro a ser identificado o grau de diferenciao d
realizado atravs do diagrama da funo de autocorrelao (ACF), no qual so
apresentados os valores das autocorrelaes em relao aos atrasos k.
Se as autocorrelaes decrescerem de forma exponencial, realizam-se
diferenciaes na srie, at que o diagrama apresente um corte abrupto para um valor
qualquer de autocorrelao, quando a srie ser considerada estacionria [22].
A anlise do comportamento das ACFs e PACFs e seus respectivos
correlogramas iro auxiliar na identificao do modelo a ser estimado.
A ordem auto-regressiva p determinada pela verificao da funo de
autocorrelao (ACF) e autocorrelao parcial (PACF) da srie estudada. Se a srie for
unicamente auto-regressiva ARIMA (p,d,0), sua funo de autocorrelao k sofrer

- 21 -

uma queda exponencial gradativa e sua funo de autocorrelao parcial kk sofrer uma
queda repentina aps o lag k, conforme pode ser visto na Figura 3.6.
Caso contrrio, efetua-se a anlise dos estimadores para verificar at que
ordem de defasagem do correlograma desta funo estatisticamente significante. Essa
ser sua ordem auto-regressiva [20].

Figura 3.6. ACF e PACF para um Modelo AR(1)


Para o caso de uma srie ser unicamente de mdia mvel ARIMA (0,d,q),
sua funo de autocorrelao k sofrer uma queda repentina aps o lag k e sua funo
de autocorrelao parcial kk sofrer uma queda exponencial gradativa, conforme pode
ser visto na Figura 3.7 [20].

Figura 3.7. ACF e PACF para um modelo MA (1)


Uma vez identificados os valores apropriados de p e q, a prxima etapa
estimar os parmetros dos termos auto-regressivo e de mdia mvel includos no
modelo, que pode ser feito pelo mtodo dos mnimos quadrados.
Escolhido o modelo ARIMA em particular e estimados seus parmetros,
parte-se para a terceira etapa que verificar se o modelo escolhido adequado para
ajustar os dados, pois possvel que outro modelo ARIMA possa desempenhar o
mesmo papel.
- 22 -

Um teste simples para avaliar o modelo escolhido analisar os resduos


estimados, pois estes devem ser rudos brancos. Caso positivo pode-se aceitar o ajuste
especfico. Caso negativo deve-se repetir processo.
Na ltima etapa, de previso, so realizadas as previses e verificada a
eficcia do modelo escolhido.
A teoria da utilizao de componentes auto-regressivos e de mdias
mveis na modelagem de sries temporais utiliza duas ideias bsicas na criao de sua
metodologia de construo de modelos:

Parcimnia, que consiste na utilizao do menor nmero possvel


de parmetros para obter uma representao adequada no fenmeno em estudo.

Construo iterativa do modelo em que a informao emprica


analisada teoricamente sendo, o resultado deste estgio confrontado com a prtica e
assim sucessivamente at a obteno de um modelo satisfatrio.
O ciclo iterativo utilizado para a anlise de uma srie temporal atravs da
metodologia de Box e Jenkins est representado na Figura 3.8:
Incio
1. Identificao dos
valores apropriados de
p, d e q.
2. Estimao dos
parmetros dos termos
auto-regressivo e de
mdia mvel

no

3. O modelo
est adequado?
sim
4. Realizao das
previses
fim

Figura 3.8. Fluxograma do Modelo ARIMA de Box e Jenkins [31]


Caso o modelo no seja adequado, o ciclo repetido, voltando-se fase
de identificao. Quando se obtm um modelo satisfatrio, passa-se para a ltima etapa
da metodologia de Box e Jenkins, que trata da realizao de previses.

- 23 -

3.3 Redes neurais artificiais


Novas descobertas no campo das redes neurais tm atrado cada vez mais
ateno nos ltimos anos. Desde 1943, quando Warren McCulloch e Walter Pitts
apresentaram o primeiro modelo de neurnios artificiais, novo e mais sofisticado,
diversas proposies foram feitas de dcada para dcada. A anlise matemtica tem
resolvido alguns dos mistrios apresentados pelos novos modelos, mas deixou muitas
perguntas em aberto para futuras investigaes [35].
Pode-se ilustrar a importncia destes estudos quando se aponta para o
perodo compreendido entre 1901 e 1991, onde cerca de dez por cento dos Prmios
Nobel de Fisiologia e Medicina foram concedidos a cientistas que contriburam para a
compreenso do crebro. No um exagero dizer que ns aprendemos mais sobre o
sistema nervoso nos ltimos 50 anos do que nunca [35].
Ao longo das ltimas dcadas o homem tem fomentado o desejo de fazer
com que as maquinas tenham capacidades similares aos seres humanos como, por
exemplo, aprendizado, tomada de decises e reconhecimento de padres, o surgimento
de algoritmos como o das redes neurais tornou estes objetivos alcanveis.
Assim como ensina-se a uma criana a reconhecer um dado objeto, como
por exemplo uma cadeira. Mostra-se a ela exemplos deste objeto e espera-se o seu
aprendizado. Neste momento importante a apresentao de diversos exemplos para
que se torne possvel a correta identificao do objeto.
Alm disso, esperado que, com a apresentao de novos objetos
diferentes dos utilizados no aprendizado, que estes sejam reconhecidos corretamente
quanto a tratar-se ou no do objeto em questo, considerando que tenha sido submetido
a esta criana muitos exemplos de casos positivos e negativos de reconhecimento do
objeto.
Este mesmo procedimento natural pode ser espelhado para o ensino de
uma rede neural.

3.3.1 Modelo de neurnio artificial


Inspirado no funcionamento de um neurnio biolgico, que consiste de
muitas entradas, correspondente aos dendritos conectados atravs das junes
sinpticas. O modelo de um neurnio apresentado na Figura 3.9 e matematicamente
descrito por [36]:
I

E!  F G!H H

( 23 )

HJ

K!  LE!  ! 

( 24)
- 24 -

em que xi so os sinais de entrada, wkj so os pesos sinpticos do neurnio k, uk a sada


do combinador linear devido aos sinais de entrada, bk o bias, L.  a funo de
ativao e yk o sinal de sada do neurnio k.
Apesar da sua contribuio, McCulloch e Pitts no apresentaram nenhum
modelo que permitisse a adaptao dos pesos sinpticos em processo de aprendizado.

Figura 3.9. Neurnio artificial projetado por McCulloch e Pitts


Somente em 1949, Donald Hebb props uma lei de aprendizado para
ajuste das sinapses dos neurnios, demonstrando que o aprendizado esta ligado a
alterao da eficincia sinptica, ou seja, a conexo somente reforada quando as
clulas pr-sinpticas a as ps-sinpticas esto excitadas, postulando assim uma frmula
matemtica simples que permitisse a alterao dos pesos sinptico dos neurnios
proporcionalmente para as ativaes do neurnio [36].
G!H N  OK! N, H (N))
G!H (N)  PK! (N)H (N)
em que uma constante positiva que determina a taxa de aprendizagem.

( 25 )
( 26 )

3.3.2 Redes multilayer perceptron


Com amplo espectro de aplicao, as redes Multilayer Perceptron tm
tido sucesso na classificao de padres, controle e processamento de sinais e na
previso de valores.
As redes Multilayer Perceptron so constitudas por um conjunto de ns
fonte que formam a camada de entrada, as camadas escondidas e a camada de sada da
rede. Com exceo da primeira, as demais camadas so dotadas de neurnios e,
portanto, apresentam capacidade computacional [36].
Exemplificada por intermdio da Figura 3.10 temos a arquitetura de uma
rede neural artificial Multilayer Perceptron com camada de entrada, duas camadas
escondidas e camada de sada.

- 25 -

Figura 3.10. Arquitetura de uma rede neural artificial multilayer perceptron com
duas camadas escondidas
Conceitualmente diz-se que uma rede neural artificial progressiva
(feedforward) quando no so definidos laos de realimentao, ou seja, as sadas dos
neurnios em quaisquer camadas esto, exclusivamente, ligadas as entradas da camada
subsequente. Como resultado tem-se que o sinal de entrada propaga-se em sentido
progressivo atravs de todas as camadas da rede. A rede multilayer perceptron uma
rede progressiva [36].
Outro aspecto a ser observado esta relacionado conectividade, ou seja, a
rede pode ser ou no completamente conectada. A rede dita completamente conectada
quando cada n de uma camada est conectado a todos os outros ns da camada
adjacente. Em caso contrrio algumas sinapses podem estar faltando. Em termos
prticos a ausncia de uma sinapse pode ser emulada com um peso constante e igual a
zero [36].

3.3.3 O algoritmo backpropagation


O algoritmo backpropagation conhecido como o mais popular
algoritmo utilizado no contexto do aprendizado de uma rede neural artificial multilayer
perceptron, ttulo adquirido em funo da sua facilidade de implementao e pelo fato
do seu grande potencial em armazenar o contedo das informaes, adquirido por
intermdio do conjunto de dados, nos pesos sinpticos da rede [36].
A utilizao deste algoritmo em uma rede multilayer perceptron far com
que ela desenvolva a capacidade de generalizar, ou seja, capacidade de apresentar um
desempenho satisfatrio quando alimentada com dados de teste retirados do mesmo
espao de entrada que os dados de treinamento, mas que no foram previamente
apresentados. Para isso preciso na etapa de treinamento apresentar a rede um conjunto
grande o suficiente de dados que represente o ambiente no qual a rede esta inserida [36].
Na etapa de treinamento, aplicao do algoritmo pode ser dividida em
duas etapas: Passo direto e passo reverso [36].

- 26 -

Passo direto
Nesta etapa os pesos sinpticos no so alterados e o sinal na camada de
entrada propagado atravs das camadas escondidas at a camada de sada, neurnio a
neurnio [36].
O sinal obtido como resultado na sada do neurnio j equacionado por
KH N  LQH N

( 27 )

onde vj(n) o potencial de ativao do neurnio j, equacionado por


I

QH N  F GHR NKR N

( 28 )

RJ

em que m o nmero total de entradas (excluindo a polarizao) aplicadas ao neurnio


j, GHR N o peso sinptico conectando a sada do neurnio i ao neurnio j, KR N o
sinal de entrada do neurnio j, ou equivalentemente, o sinal na sada do neurnio i.
Nos casos em que o neurnio j encontra-se na primeira camada
escondida, o ndice i remete ao i-simo n de entrada da rede, escreve-se:
KR N  R N

( 29 )

onde xi(n) o i-simo componente do vetor de entrada do neurnio j.


Por outro lado, quando o neurnio j est na camada de sada, o ndice j
refere-se ao j-simo n de sada da rede, escreve-se:
KH N  SH N

( 30 )

sendo oj(n) o j-simo componente do vetor de sada.


A sada obtida oj(n) ento comparada com a resposta desejada dj(n) e
esta diferena ser definida como sinal de erro ej(n) para o j-simo neurnio de sada
[36].
Contudo pode-se delimitar que o passo direto comea na apresentao do
vetor de entrada a primeira camada escondida e termina com a obteno do sinal de erro
na camada de sada [36].
Passo reverso
Iniciando-se na camada de sada, os sinais de erro sero propagados na
direo contrria atravs da rede, neurnio a neurnio, recursivamente computando os
gradientes locais para cada neurnio e corrigindo os pesos sinpticos de acordo com a
Regra Delta ( 31 ) [36].
BGHR N  PTH NKR N

( 31 )
- 27 -

em que BGHR N a correo aplicada a i-sima sinapse do neurnio j, KR N o sinal de
entrada no i-simo n de entrada do neurnio j, TH N o gradiente local do neurnio j e
P a razo de aprendizado, esta fator ser discutido mais adiante.
Para os casos em que o neurnio encontra-se na camada de sada, o
gradiente local simplesmente o sinal de erro do neurnio multiplicado pela primeira
derivada de sua no linearidade ( 32 ) [36].
TH N  LH QH NH N , neurnio j de sada.

( 32 )

em que TH N o gradiente local do neurnio j, H N sinal de erro j-simo n de sada
do neurnio j, LH QH N primeira derivada da funo de ativao associada ao
neurnio j.

Uma vez obtido o gradiente local de cada neurnio da camada de sada


faz-se o uso da ( 31 ) para corrigir os pesos sinpticos que alimentam a camada de sada.
Obtidos os gradientes locais para os neurnios da camada de sada, usase a ( 33 ) para calcular o gradiente local de cada neurnio na camada esquerda.
Calculado o gradiente local de cada neurnio da camada esquerda, usase a ( 31 ) para corrigir os pesos sinpticos que alimentam esta camada.
TH N  LH QH N ! T! NG!H N , neurnio j escondido.

( 33 )

Recursivamente este procedimento realizado, propagando as correes


nos pesos sinpticos camada por camada, at a camada de entrada.
Observa-se que durante cada ciclo ( passo direto - passo reverso ) ao
longo da apresentao do conjunto de dados para treinamento, o vetor de entrada para
cada ciclo mantido fixo.
Razo de aprendizado e fator de momento
A utilizao do algoritmo backpropagation proporciona uma
aproximao da trajetria de movimento na direo de descida sobre a superfcie de erro
no espao de pesos sinpticos. Sendo assim quanto menor for feita a razo de
aprendizado , menores sero as correes aplicadas aos pesos sinpticos em cada
iterao e mais suave ser a trajetria no espao de pesos. Como consequncia tem-se
uma lenta convergncia do algoritmo at um valor de erro suficientemente pequeno e
aceitvel [37].
Por outro lado, quando temos a razo de aprendizado muito grande, com
o intuito de acelerar a convergncia, a correo nos pesos sinpticos tambm ser
grande, deste modo o algoritmo torna-se instvel (oscilatrio).
Para acelerar a convergncia e manter estabilidade na trajetria pode-se
acrescentar Regra de Delta ( 31 ) o chamado Fator de Momento. Assim tem-se [35]:
- 28 -

GHR N  GHR N  1) + PTH (N)KR (N)

( 34 )

em que a constante denominada de Constante de Momento com 0 < < 1. Seu efeito
aumentar a velocidade da trajetria no espao de pesos na direo da descida mais
ngreme.
Situao observada quando a correo aplicada ao peso sinptico matem
seu sinal algbrico aps vrias iteraes, caracterizando uma trajetria na superfcie de
erro ao longo de uma descida acentuada, a correo do peso sinptico acelerada pelo
fator de momento, j que o mnimo global ainda deve estar longe.
No caso de um eventual mnimo local ao longo desta descida acelerada,
este pode ser facilmente transpassado.
Por outro lado, quando observa-se a troca de sinal aps algumas iterao,
caracterizando uma trajetria na superfcie de erro prxima ao mnimo global, a
correo do peso sinptico freada pela reduo do valor absoluto mdio do fator de
momento, j que um mnimo (provavelmente global) est prximo e uma alta
velocidade poderia desestabilizar o algoritmo em torno do mnimo.

- 29 -

Captulo 4
4. Metodologia
Este Captulo apresenta a metodologia utilizada para a modelagem dos
dados de consumo de gs natural para consumidores dos segmentos industrial e
automotivo da Sergipe Gs S/A - SERGAS.
No decorrer deste Captulo sero abordados os principais ndices de
desempenho que so utilizados para avaliar o quo satisfatrio so os resultados das
previses dos modelos.
Uma vez que no presente trabalho explorada a combinao de vrias
tcnicas de previso, neste captulo sero introduzidos os procedimentos para obteno
de modelos REGRESSO (linear simples, linear mltipla e no linear transformada
polinomial, exponencial, logartmica e potncia), SRIE TEMPORAL (auto-regressivo,
mdia mvel, auto-regressivo de mdia mvel e auto-regressivo integrado e de mdia
mvel) e REDES NEURAIS ARTIFICIAIS (redes Multilayer Perceptron com
aprendizado atravs do algoritmo backpropagation).

4.1 ndices de desempenho


A avaliao da qualidade da previso uma importante tarefa a ser
realizada, pois permite, por exemplo, comparar diversos algoritmos e diversas estruturas
de modelos utilizando ndices de desempenho. A seguir so apresentados alguns dos
ndices de desempenho mais utilizados em problemas de previso

O erro mdio (ME do ingls mean error):


[

1
X<  F K(Z) K;(Z)
Y
!J

( 35 )

O erro absoluto mdio (MAE do ingls mean absolute error):


[

1
X\< = F|K(Z) K;(Z)|
Y
!J

- 30 -

( 36 )

O erro quadrtico mdio (MSE do ingls mean squared error):


[

1
X^< = F(K(Z) K;(Z))
Y

( 37 )

!J

O erro percentual mdio (MPE do ingls mean percentage error):


[

1
K(Z) K;(Z)
X_< = F
100
Y
K(Z)

( 38 )

!J

O erro percentual absoluto mdio (MAPE do ingls mean


absolute percentage error):
[

1
K(Z) K;(Z)
X\_< = F `
100`
Y
K(Z)

( 39 )

!J

Com o intuito de comparar dois previsores pode-se utilizar os ndices de


desempenho mostrados nas ( 35 ) a ( 39 ), alm de tais ndices necessrio tambm
levar em considerao as caractersticas dos dados. Por exemplo, uma srie de dados
com um alto nvel de parcela estocstica, um MAPE de 10% pode ser avaliado como
um excelente desempenho. Por outro lado, uma srie de dados puramente determinstica
e estacionria com um MAPE de 1% pode indicar um pssimo previsor. Com o objetivo
de avaliar a eficincia de um previsor frente aos dados analisados, define-se a raiz do
erro quadrtico mdio normalizado (RMSE do ingls root mean square error).
aX^< =

+[
;(Z))
!J(K(Z) K
+[
b)
!J(K(Z) K

( 40 )

em que Kb o valor mdio de y(k), sendo que a mdia calculada na janela de


identificao.
Neste ndice de desempenho, o erro do previsor normalizado pelo erro
do previsor trivial (valor mdio dos dados). Sendo assim, valores prximos de 1
significam que o previsor no significativamente melhor que simplesmente usar o
valor mdio dos dados como previso. Nota-se que a utilidade do ndice RMSE
aumenta medida que a componente estocstica da srie y(k) ser torna dominante.
Para os casos em que a componente determinstica dominante, outros
ndices devem ser usados. Uma alternativa interessante
cdefRg =

+[
;(Z))
!J(K(Z) K


+[
!J(K(Z) K(Z 1))

( 41 )

Conhecido como estatstica U de Theil [38], este ndice utiliza-se da


mesma metodologia aplicada na ( 40 ) substituindo-se como previsor trivial o valor

- 31 -

mdio dos dados pelo valor anterior da srie. Da mesma forma, valores menores do que
as unidades indicam um melhor desempenho em relao ao previsor trivial.
Observa-se que o preditor trivial no U de Theil apenas a diferena de
um passo frente, tornando o previsor trivial difcil de ser superado quando se deseja
fazer a previso de mdio e longo prazo.

4.2 Descrio dos dados


Os dados de consumo foram disponibilizados pela companhia de
distribuio de gs natural do Estado de Sergipe, a Sergipe Gs S/A - SERGAS, e
compreendem o consumo horrio de gs natural dos meses de janeiro de 2011 a agosto
de 2011. Os arquivos foram disponibilizados em formato adobe acrobat e convertidos
no formato Excel, totalizando 5808 amostras. Assim, as amostras de consumo horrio
relativas ao citado perodo foram carregadas na ferramenta computacional desenvolvida.

4.3 Procedimentos para os modelos de regresso


Neste item sero descritos as tcnicas de regresso utilizadas neste
trabalho para a previso de consumo de gs natural.
Linear: Nas regresses lineares simples existe uma relao linear
implcita entre as duas variveis, chamadas de varivel dependente e independente [16].
 =  + . 

( 42 )

em que e so os coeficientes da regresso e especificam, respectivamente, o ponto


onde a reta intercepta o eixo Y e a inclinao da reta. Estes coeficientes foram
estimados pelo mtodo dos mnimos quadrados.
Polinomial: As regresses polinomiais podem ser modeladas adicionando
os termos polinomiais ao modelo linear. Isso feito transformando as variveis de
modo que a equao resultante seja uma equao linear. Neste contexto tem-se
    .    .     i .  
sendo transformada em
     .    .     . 
fazendo
   

( 43 )
( 44 )
( 45 )

Funo Exponencial: A funo exponencial   j. k il foi transformada


na funo linear mNK  mNj  . .
   . k nl

( 46 )

sendo transformada em

- 32 -

mNop  mN  . 

( 47 )

L  P  . 

( 48 )

up e  ln , a equao pode ser reescrita como:


fazendo  lnoY

na qual sero calculados os valores de e com a utilizao de mnimos quadrados e


substitudos na ( 46 ) com a seguinte transformao:
  kx

Funo Logartmica: A funo logartmica   j  . ln  foi


transformada na funo linear   j  .  .
    . mN 

( 49 )

fazendo xb  ln x ento:

    . 

( 50 )

Os valores de e so calculados com a utilizao de mnimos


quadrados.

Funo Potncia: A funo Potncia   j.  i foi transformada na


funo linear mNK  mN j  . mN .
   .  n

( 51 )

transformada em:

mNop  mN  . mN 

( 52 )

L  P  . 

( 53 )

up,  ln  e xb  ln x ento a equao pode ser reescrita como:


fazendo  lnoY

na qual sero calculados os valores de e com a utilizao de mnimos quadrados e


substitudos na ( 51 ) com a seguinte transformao:
  kx

Para o ajuste dos modelos foram utilizados os dados dirios das 01:00 s
11:00 do dia em anlise e os 24 valores horrios do dia anterior, conforme ilustrado na
Figura 4.1.
A escolha deste perodo se d pelo fato de que estes so os dados que
esto disponveis no sistema de telemetria para realizao da previso.
Para validao do modelo utiliza-se a equao calculada e estimam-se os
valores para um dia inteiro, ou seja, das 01:00 at as 24:00, conforme ilustrado no
Figura 4.2.
- 33 -

Figura 4.1. Anlise dos Ajustes da Regresso


- 34 -

Figura 4.2. Anlise dos Resultados da Regresso


- 35 -

A fim de analisar os resultados obtidos e comparar a eficincia dos


mtodos sero utilizado os ndices de Desempenho apresentados neste captulo e
exemplificado na Tabela 4.1.
Tabela 4.1. ndices de Desempenho aplicados as Regresses
TIPO
ME
LINEAR
0,50
POLINOMIAL
0,23
EXPONENCIAL - 0,42
LOGARITMICA
0,09
POTNCIA - 0,24

MAE
2,05
2,63
2,18
1,92
1,93

MSE
MPE
7,42
3,77
11,21
17,84
9,30 - 24,36
5,92 - 4,69
8,04 - 23,79

MAPE
18,19
34,46
36,51
19,78
34,97

RMSE PERODO DE AJUSTE / VALIDAO


0,85
01/08/2011 - 30/08/2011
1,05
01/08/2011 - 30/08/2011
0,95
01/08/2011 - 30/08/2011
0,76
01/08/2011 - 30/08/2011
0,89
01/08/2011 - 30/08/2011

A ordem da equao polinomial ajustada nos estudos de caso


apresentados no captulo 5 igual a dois.

4.4 Procedimentos para os modelos de sries


temporais
O presente trabalho seguiu a metodologia de Box e Jenkins na
modelagem das Sries Temporais. Na Figura 3.8 foi esquematizado o fluxograma desta
metodologia. Esta metodologia, segundo a maioria dos autores, se baseia na analise dos
dados atravs de uma estratgia interativa.
Os estgios do ciclo iterativo da metodologia Box e Jenkins so
identificao, estimao, verificao e previso.
No primeiro estgio realizada a identificao do modelo, escolhido com
base na anlise de autocorrelaes, autocorrelaes parciais e outros critrios. Nessa
etapa, identificada a necessidade de diferenciar os dados para tornar a srie
estacionria e calculada a ordem do processo auto-regressivo (p) e do processo de
mdias mveis (q). Tradicionalmente, as principais ferramentas nessa fase so as
funes de autocorrelao e autocorrelaes parciais, conforme Figura 4.3.
O prximo estgio ser a estimao dos valores dos coeficientes autoregressivo (p) e de mdias mveis (q), utilizando o mtodo de mnimos quadrados.
Seguido pelo estgio de verificao da adequao do modelo proposto a srie temporal
em anlise. Caso o modelo no seja adequado, o ciclo repetido, voltando-se fase de
identificao. Quando se obtm um modelo satisfatrio, passa-se para o ltimo estgio
da metodologia de Box e Jenkins, que trata da realizao de previses, demonstrada na
Figura 4.5.

- 36 -

Figura 4.3. Exemplo de Srie Temporal (grfico superior), Funo de


Autocorrelao (grfico central) e Funo de Autocorrelao Parcial (grfico
inferior).

Figura 4.4. Exemplo de Ajuste do Modelo (grfico superior), Erro de Ajuste do


Modelo (grfico central) e Autocorrelao do Erro de Ajuste (grfico inferior).
- 37 -

Figura 4.5. Exemplo de Previso do Modelo (grfico superior), Erro de Previso do


Modelo (grfico central) e Autocorrelao do Erro de Previso (grfico inferior).
A fim de comparar a eficincia das diversas configuraes possveis do
modelo em estudo sero utilizado os ndices de Desempenho apresentados neste
captulo, conforme demonstrado na Tabela 4.2.
Tabela 4.2. ndices de Desempenho aplicados as Sries Temporais
ARIMA
(2,0,2)
(2,1,2)
(2,0,0)
(0,0,2)

p Lags
(1 2)
(1 2)
(1 2)
()

q Lags
(3 4)
(3 4)
()
(1 2)

ME
5,34
-2,75
3,84
15,25

MAE
193,3
182,9
177,8
269,8

MSE
6,02E+04
5,63E+04
5,14E+04
1,22E+05

MPE
-5,7
21,61
-5,11
-7,06

MAPE
20,52
114,9
18,83
28,45

RMSE UTHEIL PERODO DE AJUSTE


PERODO DE VALIDAO
0,73 0,92 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,89 0,51 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,68 0,85 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
1,04 1,31 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011

4.5 Procedimentos para os modelos de redes


neurais artificiais
Para os procedimentos da RNA devem ser levados em conta escolha
das entradas do modelo, escolha do nmero de camadas escondidas, escolha do nmero
de neurnios na camada escondida, escolha das sadas, porcentagem de dados para
treinamento e validao. Algumas consideraes sobre a escolha da topologia da rede
so feitas a seguir.
Na metodologia proposta, a escolha das entradas da Rede Neural
Artificial pode ser realizada de duas formas distintas:
- 38 -


Rede Neural Artificial Padro: neste modelo tm-se como
entradas da rede os valores reais de consumo das 01:00 s 11:00 do dia atual, alm dos
valores dos 24 valores horrios do dia anterior, formando uma rede com um vetor de 35
entradas e um de 24 sadas conforme ilustrado na Figura 4.6.

Figura 4.6. Entradas da Rede Neural Artificial Padro.

Rede Neural Artificial auxiliada por Sries Temporais: neste


modelo mantem-se as entradas da Rede Neural Artificial Padro, adiciona-se um vetor
contendo os valores estimados utilizando as Sries Temporais, totalizando ao todo 59
entradas, sendo o vetor de sada modificado de forma a conter os erros obtidos no ajuste
da Srie Temporal, conforme demonstrado na Figura 4.7.

Figura 4.7. Entradas da Rede Neural Artificial auxiliada por


Sries Temporais.
Neste ltimo caso para conseguir prever o valor do consumo o erro ser
somado ao valor previsto a partir das sries temporais, conforme demonstrado na ( 54 ).
  {  k}

( 54 )

em que  o valor da sada prevista utilizando rede neural artificial auxiliada por sries
temporais, { o valor da sada prevista utilizando sries temporais e k} o valor do erro
previsto utilizando redes neurais artificiais.
Adicionalmente os modelos apresentados de redes neurais pode-se
inserir, aos j existentes vetores de entradas, um vetor contendo informaes sobre os
dias da semana codificados em nmeros binrios, mostrado na Figura 4.8. Esta prtica
visa aumentar a eficincia da rede neural para os casos em que so observadas
caractersticas particulares associadas aos dias da semana, ou seja, a existncia de um
comportamento tpico para cada dia da semana.

- 39 -

Figura 4.8. Insero do vetor codificado dos dias da semana.


O nmero de camadas escondidas assim como o nmero de neurnios
por camada escondida depende da complexidade da srie de dados em anlise, podendo
variar de apenas uma camada escondida com um neurnio at varias camadas
escondidas com vrios neurnios.
O nmero de neurnios da camada escondida normalmente obtido por
tentativas. Para cada tentativa foram realizadas vrias simulaes, inicializando a rede
em condies iniciais diferentes para tentar evitar que o algoritmo de treinamento
alcanasse um mnimo local. Para cada caso foi escolhida a simulao correspondente
ao nmero de neurnios da camada que apresentou melhor desempenho, em funo dos
ndices de desempenho.
Como forma de evitar que o treinamento alcance um mnimo local e
acelerar a convergncia e manter a trajetria estvel foi includo o Fator de Momento
Regra Delta. Tambm foi implementada a possibilidade de escolha da funo de
ativao.
Uma questo importante foi a composio dos dados para treinamento e
validao, isto , quais os dados sero usados para treinar os modelos, e quais sero
utilizados para valid-los. A literatura sugere que pelo menos 20% da base de dados seja
separada para validar os modelos obtidos na fase de treinamento [37].
A fim de comparar a eficincia das diversas configuraes possveis do
modelo em estudo foram utilizados os ndices de Desempenho apresentados neste
captulo, conforme demonstrado na Tabela 4.3.
Tabela 4.3. ndices de Desempenho aplicados as Redes Neurais Artificiais
DADOS R.N.A. TIPO R.N.A. VETOR DIA
Tan. Hip.(1,4)
PADRO
SIM
Tan. Hip.(1,4)
PADRO
NO
Tan. Hip.(1,4) PADRO + ST
SIM
Tan. Hip.(1,4) PADRO + ST
NO

ME
0,14
0,13
0,31
0,16

MAE
1,38
1,41
1,39
1,34

MSE
2,88
2,98
2,89
2,85

MPE
-8,69
-9,23
-7,71
-8,32

MAPE
18,38
19,11
18,6
18,1

RMSE UTHEIL PERODO DE AJUSTE


PERODO DE VALIDAO
0,53 0,41 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,54 0,41 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,53 0,4 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,53 0,4 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011

Na Tabela 4.3 observa-se na primeira coluna a codificao utilizada para


identificar a topologia da rede neural artificial, composta pela funo de ativao (i.e.
Tan. Hip tangente hiperblica) seguida por parnteses contendo o nmero de camadas
escondidas e o nmero de neurnios por camada escondida.

- 40 -

Captulo 5
5. Resultados
Neste captulo sero apresentados os resultados das previses de
consumo de gs utilizando os modelos descritos no captulo 4. Estes resultados tambm
so analisados e discutidos utilizando os ndices de desempenho, comentados tambm
no capitulo anterior, bem como a luz das possveis penalidades no caso da previso de
consumo exceder os limites de +5% e -10% normalmente utilizados pelos supridores na
programao diria junto s distribuidoras.
Neste contexto sero comparados os melhores resultados obtidos em cada
modelo frente s diferentes configuraes utilizadas e, em seguida, comparado o melhor
resultado frente ao modelo adotado atualmente na companhia distribuidora em anlise.
Nos estudos de caso deste trabalho utilizaram-se os dados dos dias
compreendidos entre 01/01/2011 e 31/07/2011 para treinamento e entre 01/08/2011 e
31/08/2011 para validao.
Os resultados sero apresentados nas sees a seguir.

5.1 Consumidor industrial A


A Figura 5.1 mostra o perfil de consumo do CONSUMIDOR
INDUSTRIAL A.

Figura 5.1. Perfil de consumo do CONSUMIDOR INDUSTRIAL A.

5.1.1 Modelo de regresso


Para os modelos de regresso foram obtidos os resultados apresentados
na Tabela 5.1.
- 41 -

Tabela 5.1. Resultados obtidos com Regresses.


MODELO
LINEAR
POLINOMIAL
EXPONENCIAL
LOGARITMICA
POTNCIA

ME
0,50
0,23
-0,42
0,09
-0,24

MAE
2,05
2,63
2,18
1,92
1,93

MSE
7,42
11,21
9,30
5,92
8,04

MPE
3,77
17,84
-24,36
-4,69
-23,79

MAPE
18,19
34,46
36,51
19,78
34,97

RMSE
0,85
1,05
0,95
0,76
0,89

PERODO DE AJUSTE / VALIDAO


01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Tabela 5.1 possvel observar que os melhores resultados, do ponto


de vista dos ndices de desempenho, so da Regresso Logartmica (melhores ME,
MAE, MSE e RMSE), seguido pela Regresso Linear (melhores MPE e MAPE). A
Figura 5.2 apresenta os resultados das citadas regresses frente ao resultado desejado,
alm disso, os limites superior e inferior desejado para a previso, que so de +5% e 10% respectivamente.

Figura 5.2. Anlise das Curvas de Regresso Melhores Resultados


Nas Figura 5.3 e Figura 5.4 pode ser verificado o erro percentual para
cada amostra, assim como, a aplicao de penalidades em funo da extrapolao dos
limites superiores e inferiores.
A Tabela 5.2 mostra os resultados do ponto de vista de aplicao das
penalidades, onde mais uma vez foi constatado que a regresso Logartmica obteve o
melhor desempenho quando da aplicao de penalidades, destacando-se na reduo das
penalidades por erros a menor, ou seja, penalidades aplicadas por exceder o limite
inferior desejado de -10%.

- 42 -

Tabela 5.2. Aplicao de Penalidades - Regresso


MODELO DE
REGRESSO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

LINEAR
LOGARITMICA

24,14%
34,49%

75,86%
65,51%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
41,38%
41,37%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
34,45%
24,14%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Diante das observaes realizadas, seja ela do ponto de vista dos ndices
de desempenho, seja do ponto de vista da aplicao de penalidades, o modelo de
regresso logartmica apresentou o melhor desempenho para o conjunto de dados em
questo, por ele amortecer a curva de previso evitando que sejam realizadas
programaes de volumes excessivas e que no sero atingidas, reduzindo assim a
aplicao de penalidades por erros a menor.

Figura 5.3. Aplicao de Penalidades Regresso Linear

- 43 -

Figura 5.4. Aplicao de Penalidades Regresso Logartmica

5.1.2 Modelo de srie temporal


Para o modelo de sries temporais, as parametrizaes que obtiveram os
melhores resultados esto contidas na Tabela 5.3.
Tabela 5.3. Resultados obtidos com Sries Temporais
ARIMA
(4,0,2)
(4,0,4)
(4,0,0)
(3,0,0)

p Lags q Lags
(1 2 3 4) (5 6)
(1 2 3 4) (5 6 7 8)
(1 2 3 4)
()
(1 2 3)
()

ME
0,00
0,00
0,00
0,00

MAE
0,10
0,10
0,10
0,10

MSE
0,02
0,02
0,02
0,02

MPE
-4,61
-4,72
-4,90
-4,94

MAPE RMSE UTHEIL PERODO DE AJUSTE


PERODO DE VALIDAO
18,18 0,66
0,84 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
18,26 0,66
0,84 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
18,51 0,67
0,84 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
18,59 0,67
0,85 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011

A partir dos dados da Tabela 5.3 possvel observar que, no mbito das
series temporais, o modelo que melhor se adqua a srie em estudo
predominantemente auto-regressivo com pequenas variaes nos ndices de
desempenho quando utilizado uma parametrizao com Mdias Mveis. Este
comportamento, por sua vez, j poderia ser previsto analisando os grficos da
Autocorrelao (ACF) e da Autocorrelao Parcial (PACF), pois para uma srie
unicamente auto-regressiva ARIMA (p,0,0), sua funo de autocorrelao sofrer uma
queda exponencial gradativa, conforme pode ser visto na Figura 5.5 e sua funo de
autocorrelao parcial sofrer uma queda repentina aps o lag k, conforme pode ser
visto na Figura 5.6 [20].

- 44 -

Figura 5.5. Autocorrelao (ACF) da Srie Temporal

Figura 5.6. Autocorrelao Parcial (PACF) da Srie Temporal


A Figura 5.7 apresenta os resultados obtidos na validao do modelo
ARIMA(4,0,0).

Figura 5.7. Validao do modelo Sries Temporais.


importante ressaltar que, conforme citado no captulo 3 no texto
referente etapa 3 da metodologia de Box e Jenkins, um teste simples para verificar o
ajuste e validao do modelo analisar se o erro um rudo branco, caracterizado por
possuir mdia zero, varincia constante 2 e no ser autocorrelacionado, caractersticas
estas que podem ser confirmadas por intermdio das Figura 5.8 e Figura 5.9.

Figura 5.8. Anlise do erro de validao do modelo

- 45 -

Figura 5.9. Autocorrelao do erro de validao


A Tabela 5.4 apresenta os resultados do ponto de vista de aplicao das
penalidades, onde pode-se destacar o melhor desempenho para um modelo unicamente
auto-regressivo [ARIMA (4,0,0)], sendo evidenciado para este modelo uma reduo das
penalidades aplicadas, por exceder o limite inferior desejado, frente outras
configuraes.
Tabela 5.4. Aplicao de Penalidades Sries Temporais
MODELO DE
SRIES
TEMPORAIS

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

(4,0,2)
(4,0,4)
(4,0,0)
(3,0,0)

51,74%
51,74%
55,17%
51,74%

48,26%
48,26%
44,82%
48,26%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
24,13%
24,13%
24,13%
24,13%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
24,13%
24,13%
20,68%
24,13%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Figura 5.10 pode ser verificado o erro percentual para cada amostra,
assim como, a aplicao de penalidades em funo da extrapolao dos limites
superiores e inferiores.

Figura 5.10. Aplicao de Penalidades Srie Temporal


- 46 -

Diante das observaes realizadas o modelo ARIMA unicamente autoregressivo apresentou um melhor desempenho, pois conforme dito anteriormente,
atravs da anlise dos correlogramas ACF e PACF, havia um forte indicio de que a srie
seria modelada com um modelo ARIMA(p,0,0) confirmado por intermdio dos grficos
e tabelas apresentadas nesta seo.

5.1.3 Modelo de rede neural Artificial


Na Tabela 5.5 esto apresentados os melhores resultados obtidos aps a
utilizao de diferentes configuraes de Rede Neural Artificial.
Tabela 5.5. Resultados obtidos com Redes Neurais
DADOS R.N.A. TIPO R.N.A. VETOR DIA
Sigmoide(2,2) PADRO
SIM
Tan. Hip.(3,2)
PADRO
NO
Sigmoide(2,3) PADRO + ST
SIM
Sigmoide(1,1) PADRO + ST
NO

ME
0,23
-0,33
0,30
-0,17

MAE
1,31
1,32
1,28
1,18

MSE
2,76
3,01
2,35
2,29

MPE
-6,82
-11,69
-4,82
-9,17

MAPE
17,06
18,14
14,79
15,49

RMSE UTHEIL PERODO DE AJUSTE


PERODO DE VALIDAO
0,52 0,40 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,54 0,42 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,48 0,37 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,47 0,36 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011

Na Tabela 5.5 possvel observar que os melhores resultados, do ponto


de vista dos ndices de desempenho, so da configurao da rede neural artificial com
funo de ativao sigmoide, com uma camada escondida e um neurnio por camada,
auxiliada por sries temporais e sem a insero do vetor codificado dias da semana
(melhores ME, MAE, MSE, RMSE e UTHEIL), seguida pela configurao com funo
de ativao sigmoide, com duas camadas escondida e trs neurnios por camada,
auxiliada por sries temporais e com a insero do vetor codificado dias da semana
(melhores MPE e MAPE).
Ao analisar as Figura 5.11 e Figura 5.12, em que so apresentados os
resultados das configuraes com melhor desempenho frente ao resultado desejado,
constata-se que os resultados obtidos esto muito prximos, com diferenas no
significativas para alguns dias, e do ponto de vista de aplicao de penalidades, por
intermdio da Tabela 5.6, verifica-se que a configurao com mais camadas escondidas
apresentou um desempenho 3% superior outra configurao, tambm no
significativa, sendo assim no pode-se concluir que o melhor desempenho esta
associado ao nmero maior de camadas, restando apenas hiptese de que o melhor
desempenho esta associado ao auxilio das sries temporais frente aos modelos que no
utilizam o citado auxlio.
Tabela 5.6. Aplicao de Penalidades Redes Neurais Artificiais
MODELO DE RNA

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

Sigmoide(2,3)
Sigmoide(1,1)

68,96%
65,51%

31,03%
34,48%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
27,58%
31,03%

- 47 -

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
3,44%
3,44%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Figura 5.11. Anlise das Curvas das Redes Neurais Artificiais SIGMOIDE (1,1)

Figura 5.12. Anlise das Curvas das Redes Neurais Artificiais SIGMOIDE (2,3)

5.1.4 Comparao dos resultados


Nas Tabela 5.7 e Tabela 5.8 so apresentados, respectivamente, o
comparativo entre os melhores resultados do ponto de vista dos ndices de desempenho
e da aplicao de penalidades.
- 48 -

Tabela 5.7. Quadro comparativo dos ndices de desempenho


MODELO
REGRESSO
SRIE TEMPORAL
RNA
RNA + ST

ME
0,09
0,00
0,23
0,30

MAE
1,92
0,10
1,31
1,28

MSE
5,92
0,02
2,76
2,35

MPE
-4,69
-4,90
-6,82
-4,82

MAPE
19,78
18,51
17,06
14,79

RMSE
0,76
0,67
0,52
0,48

UTHEIL PERODO DE VALIDAO


01/08/2011 - 30/08/2011
0,84
01/08/2011 - 30/08/2011
0,40
01/08/2011 - 30/08/2011
0,37
01/08/2011 - 30/08/2011

Tabela 5.8. Quadro comparativo da aplicao de penalidade


MODELO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

REGRESSO
SRIES TEMPORAIS
RNA
RNA + ST

34,49%
55,17%
51,72%
68,96%

65,51%
44,82%
48,27%
31,03%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
41,37%
24,13%
24,13%
27,58%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
24,14%
20,68%
24,13%
3,44%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Analisando as Tabela 5.7 e Tabela 5.8 possvel afirmar que:


Os melhores ndices de desempenho no significam
necessariamente que o modelo o mais adequado para reduo da aplicao de
penalidade, objetivo principal deste trabalho;
O modelo que apresentou o melhor MAPE foi tambm o que
apresentou os melhores resultados sob a tica da aplicao de penalidades;
Para o conjunto de dados analisado, o modelo que obteve a menor
ndice de aplicao de penalidade foi rede neural artificial auxiliada por sries
temporais;
Entre os modelos propostos e analisados, a rede neural artificial auxiliada
por sries temporais obteve os melhores resultados, consequncia da diviso do
processo de previso em duas etapas. Na primeira etapa, o modelo ARIMA foi
responsvel por gerar os parmetros do consumo (o melhor modelo) e realizar a
previso desejada. Na segunda etapa a rede neural artificial realizou a previso do erro
substituindo-o no modelo ARIMA para enfim realizar a previso.
Quando comparado com a metodologia atual, o modelo de rede neural
artificial auxiliada por srie temporal apresenta uma reduo de 27,02% na aplicao de
penalidades, conforme demonstrado na Tabela 5.9. Isto se deve ao fato da metodologia
proposta demonstrar grande robustez na modelagem do perfil de consumo e
consequentemente uma melhor previso de mdio prazo do consumo de gs natural.
Tabela 5.9. Quadro comparativo com a metodologia atual.
MODELO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

METODOLIGIA ATUAL
RNA + ST

41,94%
68,96%

58,06%
31,03%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
45,16%
27,58%

- 49 -

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
12,90%
3,44%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

5.2 Consumidor industrial B


Na Figura 5.13 apresentado o perfil de consumo do CONSUMIDOR
INDUSTRIAL B.

Figura 5.13. Perfil de consumo do CONSUMIDOR INDUSTRIAL B.

5.2.1 Modelo de regresso


Para os modelos de regresso foram obtidos os resultados apresentados
na Tabela 5.10:
Tabela 5.10. Resultados obtidos com Regresses.
TIPO
LINEAR
POLINOMIAL
EXPONENCIAL
LOGARITMICA
POTNCIA

ME
-0,09
0,12
-2,76
-0,07
-2,82

MAE
1,33
1,85
3,40
1,40
3,30

MSE
4,29
7,33
35,53
4,99
36,31

MPE
-6,90
19,08
-102,70
-15,20
-91,34

MAPE
27,14
46,35
110,10
37,09
96,96

RMSE
0,89
1,14
2,57
0,96
2,60

PERODO DE AJUSTE / VALIDAO


01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Tabela 5.10 possvel observar que os melhores resultados, do ponto


de vista dos ndices de desempenho, so da Regresso Linear (melhores MAE, MPE,
MAPE e RMSE), seguido pela Regresso Logartmica (melhores ME e MSE). Na
Figura 5.14 so apresentados os resultados das citadas regresses frente ao resultado
desejado, alm disso, os limites superior e inferior desejado para a previso, que so de
+5% e -10% respectivamente.

- 50 -

Figura 5.14. Anlise das Curvas de Regresso Melhores Resultados


Nas Figura 5.15 e Figura 5.16 pode ser verificado o erro percentual para
cada amostra, assim como, a aplicao de penalidades em funo da extrapolao dos
limites superiores e inferiores.
Na Tabela 5.11, que apresenta os resultados do ponto de vista de
aplicao das penalidades, possvel observar que os dois modelos foram equivalentes.
Tabela 5.11. Aplicao de Penalidades - Regresso
MODELO DE
REGRESSO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

LINEAR
LOGARITMICA

55,17%
55,17%

44,82%
44,82%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
31,03%
31,03%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
13,79%
13,79%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Diante das observaes realizadas do ponto de vista da aplicao de


penalidades, os modelos de regresso linear e logartmica apresentam desempenho
equivalente para o conjunto de dados em questo, isto se deve ao fato de que esta srie
possui um comportamento crescente e constante podendo o mesmo ser modelado tanto
por uma equao linear quanto por uma equao logartmica.

- 51 -

Figura 5.15. Aplicao de Penalidades Regresso Linear

Figura 5.16. Aplicao de Penalidades Regresso Logartmica

- 52 -

5.2.2 Modelo de srie temporal


Para o modelo de sries temporais, as parametrizaes que obtiveram os
melhores resultados esto contidas na Tabela 5.12.
Tabela 5.12. Resultados obtidos com Sries Temporais
ARIMA p Lags
(1,0,0)
(1)
(2,0,0)
(1 2)
(3,0,0) (1 2 3)
(4,0,0) (1 2 3 4)

q Lags
()
()
()
()

ME
0
0
0
0

MAE
0,01
0,01
0,01
0,01

MSE
0
0
0
0

MPE
-0,24
-0,34
-0,33
-0,35

MAPE
4,45
4,55
4,56
4,56

RMSE
0,25
0,25
0,25
0,25

UTHEIL
0,99
0,97
0,97
0,97

PERODO DE AJUSTE
01/07/2011 - 31/07/2011
01/07/2011 - 31/07/2011
01/07/2011 - 31/07/2011
01/07/2011 - 31/07/2011

PERODO DE VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

A partir dos dados da Tabela 5.12 possvel observar que, no mbito das
series temporais, o modelo que melhor se adqua a srie em estudo estritamente autoregressivo. Este comportamento, por sua vez, j poderia ser previsto analisando os
grficos da Autocorrelao (ACF) e da Autocorrelao Parcial (PACF), pois para uma
srie unicamente auto-regressiva ARIMA (p,0,0), sua funo de autocorrelao sofrer
uma queda exponencial gradativa, conforme pode ser visto na Figura 5.17 e sua funo
de autocorrelao parcial sofrer uma queda repentina aps o lag k, conforme pode ser
visto na Figura 5.18 [20].

Figura 5.17 . Autocorrelao (ACF) da Srie Temporal

Figura 5.18. Autocorrelao Parcial (PACF) da Srie Temporal


A Figura 5.19 apresenta os resultados obtidos na validao do modelo
ARIMA(1,0,0).

Figura 5.19. Validao do modelo Sries Temporais.


- 53 -

Analisando o correlograma dos resduos, ilustrado na Figura 5.20, notase que no h valores significativos para os coeficientes de autocorrelao, e que,
portanto, os resduos so um rudo branco, apresentado na Figura 5.21. Pela
metodologia de Box e Jenkins chega-se a um modelo apropriado para descrever o perfil
de consumo.

Figura 5.20. Anlise do erro de validao do modelo

Figura 5.21. Autocorrelao do erro de validao


Na Tabela 5.13, que apresenta os resultados do ponto de vista de
aplicao das penalidades, possvel observar desempenho equivalente para os modelos
estritamente auto-regressivo e destacar o melhor desempenho do modelo ARIMA
(4,0,0), sendo evidenciado, para este modelo, uma reduo das penalidades por erros a
menor frente outras configuraes.
Tabela 5.13. Aplicao de Penalidades Sries Temporais
MODELO DE SRIES
TEMPORAIS

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

(1,0,0)
(2,0,0)
(3,0,0)
(4,0,0)

79,31%
79,31%
79,31%
82,75%

20,68%
20,68%
20,68%
17,24%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
13,79%
13,79%
13,79%
13,79%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
6,89%
6,89%
6,89%
3,44%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Figura 5.22 pode ser verificado erro percentual para cada amostra,
assim como, a aplicao de penalidades em funo da extrapolao dos limites
superiores e inferiores.

- 54 -

Figura 5.22. Anlise Financeira dos Resultados Srie Temporal


Finalizada as observaes a cerca do modelo ARIMA pode-se confirmar,
por intermdio dos grficos e tabelas apresentadas nesta seo, que o modelo
unicamente auto-regressivo obteve o melhor desempenho, pois atravs da anlise dos
correlogramas ACF e PACF, j tinha-se indicativos de que a srie seria modelada com
um ARIMA(p,0,0).

5.2.3 Modelo de rede neural Artificial


Na Tabela 5.14 so apresentados os melhores resultados obtidos com a
utilizao de diferentes configuraes da Rede Neural Artificial.
Tabela 5.14. Resultados obtidos com Redes Neurais
DADOS R.N.A. TIPO R.N.A. VETOR DIA
Tan. Hip.(2,2) PADRO
SIM
Tan. Hip.(2,2) PADRO
NO
Tan. Hip.(1,2) PADRO + ST
SIM
Tan. Hip.(2,2) PADRO + ST
NO

ME
-0,04
-0,07
-0,05
-0,08

MAE
0,09
0,10
0,10
0,15

MSE
0,01
0,02
0,02
0,04

MPE MAPE RMSE


-0,59 1,14 0,05
-0,92 1,44 0,06
-0,61 1,35 0,05
-0,83 2,29 0,09

UTHEIL
0,04
0,04
0,04
0,07

PERODO DE AJUSTE
01/07/2011 - 31/07/2011
01/07/2011 - 31/07/2011
01/07/2011 - 31/07/2011
01/07/2011 - 31/07/2011

PERODO DE VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Tabela 5.14 possvel observar que o melhor resultado da


configurao da rede neural artificial com funo de ativao tangente hiperblica, com
duas camadas escondida e dois neurnios por camada, sem o auxlio por sries
temporais e com a insero do vetor codificado dias da semana em todos os ndices de
desempenho, seguida pela configurao com funo de ativao tangente hiperblica,
com uma camada escondida e dois neurnios, com o auxlio por sries temporais e com
a insero do vetor codificado dias da semana.
- 55 -

Nas Figura 5.23 e Figura 5.24, que apresentam os resultados das


configuraes com melhor desempenho frente ao resultado desejado, constata-se que os
resultados obtidos esto muito prximos, com diferenas no significativas para alguns
dias.
Tabela 5.15. Aplicao de Penalidades Redes Neurais Artificiais
MODELO DE
RNA

TIPO R.N.A.

Tan. Hip.(2,2)
Tan. Hip.(1,2)

PADRO
PADRO + ST

VETOR DIA

PERCENTUAL
DE ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

SIM
SIM

100,00%
100,00%

0,00%
0,00%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
0,00%
0,00%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
0,00%
0,00%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

No tocante a aplicao de penalidades, apresentada na Tabela 5.15,


verifica-se que as duas configuraes reduzem a aplicao de penalidades a zero, sendo
assim pode-se concluir o modelo redes neurais artificiais, auxiliado ou no por sries
temporais, resolve o problema da previso de consumo para o consumidor em questo,
tal fato se deve as caractersticas de linearidade e sazonalidade semanal facilmente
generalizada pelo algoritmo de aprendizado da rede neural artificial.

Figura 5.23. Anlise das Curvas das Redes Neurais Artificiais TAN H (2,2)

- 56 -

Figura 5.24. Anlise das Curvas das Redes Neurais Artificiais TAN H (1,2)

5.2.4 Comparao dos resultados


As Tabela 5.16 e Tabela 5.17 apresentam, respectivamente, o
comparativo entre os melhores resultados do ponto de vista dos ndices de desempenho
e da aplicao de penalidades.
Tabela 5.16. Quadro comparativo dos modelos
MODELO
REGRESSO
SRIE TEMPORAL
REDE NEURAL ARTIFICIAL
RNA + ST

ME
-0,09
0,00
-0,04
-0,05

MAE
1,33
0,01
0,09
0,10

MSE
4,29
0,00
0,01
0,02

MPE
-6,90
-0,35
-0,59
-0,61

MAPE
27,14
4,56
1,14
1,35

RMSE
0,89
0,25
0,05
0,05

UTHEIL PERODO DE VALIDAO


01/08/2011 - 30/08/2011
0,97
01/08/2011 - 30/08/2011
0,04
01/08/2011 - 30/08/2011
0,04
01/08/2011 - 30/08/2011

Tabela 5.17. Quadro comparativo da aplicao de penalidade


MODELO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

REGRESSO
SRIES TEMPORAIS
RNA
RNA + ST

55,17%
82,75%
100,00%
100,00%

44,82%
17,24%
0,00%
0,00%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
31,03%
13,79%
0,00%
0,00%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
13,79%
3,44%
0,00%
0,00%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Analisando as tabelas acima possvel afirmar que:


Os melhores ndices de desempenho no significam
necessariamente que o modelo o mais adequado para reduo da aplicao de
penalidade, objetivo principal deste trabalho;
- 57 -

O modelo que apresentou o melhor MAPE foi tambm o que


apresentou os melhores resultados sob a tica da aplicao de penalidades;
Para o conjunto de dados analisado os modelos de rede neural
artificial, auxiliada ou no por sries temporais, apresentam os melhores desempenhos,
reduzindo a aplicao de penalidades zero;
Entre os modelos propostos e analisados, visualmente percebe-se que o
modelo de rede neural artificial, auxiliada ou no por sries temporais, consegue
generalizar a dinmica da srie de consumo em estudo. Tanto a tendncia da srie,
quanto as oscilaes sazonais so absorvidas pelo modelo. Os ndices de desempenho,
assim como a aplicao de penalidades, revelam que o modelo apresenta bom
desempenho para previses de mdio prazo.
Quando comparado com a metodologia atual, o modelo de rede neural
artificial apresenta uma reduo de 22,58% na aplicao de penalidades, conforme
demonstrado na Tabela 5.18. Isto se deve ao fato da metodologia proposta demonstrar
capacidade de generalizar a dinmica da srie de consumo em estudo, tanto da tendncia
da srie, quanto as oscilaes sazonais na modelagem do perfil de consumo e
consequentemente na melhor previso de mdio prazo do consumo de gs natural.
Tabela 5.18. Quadro comparativo com a metodologia atual

MODELO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

METODOLIGIA ATUAL
RNA OU RNA + ST

77,42%
100,00%

22,58%
0,00%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
22,58%
0,00%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
0,00%
0,00%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

5.3 Consumidor GNV A


Na Figura 5.25Erro! Fonte de referncia no encontrada.
apresentado o perfil de consumo do CONSUMIDOR GNV A.

Figura 5.25. Perfil de consumo do CONSUMIDOR GNV A.

5.3.1 Modelo de regresso


Para os modelos de regresso foram obtidos os resultados apresentados
na Tabela 5.19Erro! Fonte de referncia no encontrada..

- 58 -

Tabela 5.19. Resultados obtidos com Regresses.


TIPO
LINEAR
POLINOMIAL
EXPONENCIAL
LOGARITMICA
POTNCIA

ME
-0,09
3,11
-0,76
-0,23
-0,69

MAE
0,57
3,11
1,49
0,49
1,13

MSE
0,51
11,34
5,20
0,39
2,49

MPE
-2,05
52,33
-14,61
-4,25
-12,97

MAPE
9,96
52,33
26,25
8,70
19,87

RMSE
1,12
5,27
3,57
0,98
2,47

PERODO DE AJUSTE / VALIDAO


01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Tabela 5.19 possvel observar que os melhores resultados, do ponto


de vista dos ndices de desempenho, so da Regresso Logartmica (melhores MAE,
MSE, MAPE e RMSE), seguido pela Regresso Linear (melhores ME e MPE). Na
Figura 5.26 so apresentados os resultados das citadas regresses frente ao resultado
desejado, alm disso, os limites superior e inferior desejado para a previso, que so de
5% e 10% respectivamente.

Figura 5.26. Anlise das Curvas de Regresso Melhores Resultados


Nas Figura 5.27 e Figura 5.28 pode ser verificado o erro percentual para
cada amostra, assim como, a aplicao de penalidades em funo da extrapolao dos
limites superiores e inferiores.
Na Tabela 5.20 so apresentados os resultados do ponto de vista de
aplicao das penalidades, onde mais uma vez foi constatado que a regresso
Logartmica obteve um melhor desempenho quando da aplicao de penalidades,
destacando-se na reduo das penalidades por erros a menor.
- 59 -

Tabela 5.20. Aplicao de Penalidades - Regresso


MODELO DE
REGRESSO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

LINEAR
LOGARITMICA

44,82%
48,27%

55,17%
51,72%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
34,48%
41,37%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
20,68%
10,34%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Diante das observaes realizadas, seja ela do ponto de vista dos ndices
de desempenho, seja do ponto de vista da aplicao de penalidades, o modelo de
regresso logartmica apresentou um melhor desempenho para o conjunto de dados em
questo, por ele amortecer a curva de previso evitando que sejam realizadas
programaes de volumes excessivas e que no sero atingidas, reduzindo assim a
aplicao de penalidades por erros a menor.

Figura 5.27. Aplicao de Penalidades Regresso Linear

- 60 -

Figura 5.28. Aplicao de Penalidades Regresso Logartmica

5.3.2 Modelo de srie temporal


Para o modelo de sries temporais, as parametrizaes que obtiveram os
melhores resultados esto contidas na Tabela 5.21.
Tabela 5.21. Resultados obtidos com Sries Temporais
ARIMA p Lags
q Lags
(4,0,1) (1 2 23 24) (3)
(4,0,0) (1 2 23 24)
()
(4,0,2) (1 2 23 24) (3 22)
(2,0,0)
(1 24)
()

ME
0,00
0,00
0,00
0,00

MAE
0,10
0,10
0,10
0,10

MSE
0,01
0,01
0,02
0,02

MPE
-12,72
-12,80
-13,67
-13,80

MAPE RMSE UTHEIL PERODO DE AJUSTE


PERODO DE VALIDAO
38,48 0,82
0,74 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
38,67 0,82
0,74 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
39,28 0,84
0,76 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
40,46 0,86
0,78 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011

A partir dos dados da Tabela 5.21 possvel observar que, no mbito das
series temporais, o modelo que melhor se adqua a srie em estudo o ARMA. Este
comportamento, por sua vez, pode ser antecipado analisando os grficos da
Autocorrelao (ACF) e da Autocorrelao Parcial (PACF), pois para uma srie autoregressiva mdia mvel, ARIMA (p,0,q), sua funo de autocorrelao, assim como sua
funo de autocorrelao parcial sofrero uma queda exponencial gradativa e/ou
oscilaes senoidais, conforme pode ser visto nas Figura 5.29 e Figura 5.30 [31].

Figura 5.29. Autocorrelao (ACF) da Srie Temporal


- 61 -

Figura 5.30. Autocorrelao Parcial (PACF) da Srie Temporal


A Figura 5.31 apresenta os resultados obtidos na validao do modelo
ARIMA(4,0,2).

Figura 5.31. Validao do modelo Sries Temporais.


importante ressaltar que, conforme citado no captulo 3 no texto
referente etapa 3 da metodologia de Box e Jenkins, um teste simples para verificar o
ajuste e validao do modelo analisar se o erro um rudo branco, caracterizado por
possuir mdia zero, varincia constante 2 e no ser autocorrelacionado, caractersticas
estas que podem ser confirmadas por intermdio das Figura 5.32 e Figura 5.33.

Figura 5.32. Anlise do erro de validao do modelo

Figura 5.33. Autocorrelao do erro de validao


A Tabela 5.22 apresenta os resultados do ponto de vista de aplicao das
penalidades, onde se pode destacar o melhor desempenho para um modelo ARMA
[ARIMA (4,0,2)], sendo evidenciado para este modelo uma reduo das penalidades por
erros a menor frete as outras configuraes.
- 62 -

Tabela 5.22. Aplicao de Penalidades Sries Temporais


MODELO DE SRIES
TEMPORAIS

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

(4,0,1)
(4,0,0)
(4,0,2)
(2,0,0)

24,13%
24,13%
31,03%
27,58%

75,86%
75,86%
68,96%
72,41%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
0,00%
0,00%
0,00%
3,44%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
75,86%
75,86%
68,96%
68,96%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Na Figura 5.34 pode ser verificado erro percentual para cada amostra do
melhor ajuste, assim como, a aplicao de penalidades em funo da extrapolao dos
limites superiores e inferiores.

Figura 5.34. Aplicao de Penalidades Srie Temporal


Diante das observaes realizadas o modelo ARMA auto-regressivo e
mdia mvel apresentou um melhor desempenho, pois conforme dito anteriormente,
atravs da anlise dos correlogramas ACF e PACF, havia um forte indicio de que a srie
seria modelada com um modelo ARIMA(p,0,q) confirmado por intermdio dos grficos
e tabelas apresentadas nesta seo

5.3.3 Modelo de rede neural artificial

- 63 -

Na Tabela 5.23Erro! Fonte de referncia no encontrada. so


apresentados os melhores resultados obtidos com a utilizao de diferentes
configuraes da Rede Neural Artificial.
Tabela 5.23. Resultados obtidos com Redes Neurais
DADOS R.N.A. TIPO R.N.A. VETOR DIA
Sigmoide(3,2) PADRO
SIM
Sigmoide(1,3) PADRO
NO
Sigmoide(1,3) PADRO + ST
SIM
Tan. Hip.(2,2) PADRO + ST NO

ME
0,10
0,07
0,09
0,03

MAE
0,36
0,35
0,35
0,33

MSE
0,22
0,22
0,23
0,23

MPE MAPE RMSE UTHEIL PERODO DE AJUSTE PERODO DE VALIDAO


0,90 5,87 0,73 0,70 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,60 5,76 0,73 0,69 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
0,77 5,73 0,75 0,71 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011
-0,22 5,46 0,74 0,70 01/07/2011 - 31/07/2011 01/08/2011 - 30/08/2011

Na Tabela 5.23 possvel observar que os melhores resultados, do ponto


de vista dos ndices de desempenho, so da configurao da rede neural artificial com
funo de ativao tangente hiperblica, com duas camadas escondida e dois neurnios
por camada, com o auxlio por sries temporais e sem a insero do vetor codificado
dias da semana (melhores ME, MAE, MPE e MAPE), seguida pela configurao com
funo de ativao sigmoide, com uma camada escondida e trs neurnios por camada,
sem auxlio por sries temporais e sem a insero do vetor codificado dias da semana
(melhores MSE, RMSE e UTHEIL).
Analisando-se as Figura 5.35 e Figura 5.36, na qual so apresentados os
resultados das configuraes com melhor desempenho frente ao resultado desejado,
constata-se que os resultados obtidos esto muito prximos, com diferenas no
significativas para alguns dias, e do ponto de vista de aplicao de penalidades, por
intermdio da Tabela 5.24, verifica-se que a configurao no auxiliada por sries
temporais apresentou um desempenho 10,35% superior outra configurao, apontando
para a hiptese de que o melhor desempenho no esta associado ao auxilio das sries
temporais e sim a capacidade da rede em generalizar a dinmica da srie de consumo
em estudo, tanto da tendncia da srie, quanto as oscilaes sazonais presente no perfil.
Tabela 5.24. Aplicao de Penalidades Redes Neurais Artificiais
MODELO DE
RNA

TIPO R.N.A.

Tan. Hip.(2,2) PADRO + ST


Sigmoide(1,3)
PADRO

VETOR DIA

PERCENTUAL
DE ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

NO
NO

62,06%
72,41%

37,93%
27,58%

- 64 -

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
27,58%
17,24%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
10,34%
10,34%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Figura 5.35. Anlise das Curvas das Redes Neurais Artificiais TAN H (2,2)

Figura 5.36. Anlise das Curvas das Redes Neurais Artificiais SIGMOIDE (1,3)

- 65 -

5.3.4 Comparao dos resultados


Nas Tabela 5.25 e Tabela 5.26 so apresentados, respectivamente, o
comparativo entre os melhores resultados do ponto de vista dos ndices de desempenho
e da aplicao de penalidades.
Tabela 5.25. Quadro comparativo dos modelos
MODELO
REGRESSO
SRIE TEMPORAL
REDE NEURAL ARTIFICIAL
RNA + ST

ME
-0,23
0,00
0,07
0,03

MAE
0,49
0,10
0,35
0,33

MSE
0,39
0,02
0,22
0,23

MPE
-4,25
-13,67
0,60
-0,22

MAPE
8,70
39,28
5,76
5,46

RMSE
0,98
0,84
0,73
0,74

UTHEIL PERODO DE VALIDAO


01/08/2011 - 30/08/2011
0,76
01/08/2011 - 30/08/2011
0,69
01/08/2011 - 30/08/2011
0,70
01/08/2011 - 30/08/2011

Tabela 5.26. Quadro comparativo da aplicao de penalidade


MODELO

PERCENTUAL DE
ACERTOS

PERCENTUAL
APLICAO DE
PENALIDADES

REGRESSO
SRIES TEMPORAIS
RNA
RNA + ST

48,27%
31,03%
72,41%
62,06%

51,72%
68,96%
27,58%
37,93%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MAIOR
41,37%
0,00%
17,24%
27,58%

PERCENTUAL DE
APLICAO DE
PENALIDADES POR
ERROS A MENOR
10,34%
68,96%
10,34%
10,34%

PERODO DE AJUSTE /
VALIDAO
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011
01/08/2011 - 30/08/2011

Analisando as tabelas acima pode-se dizer que:


Os melhores ndices de desempenho no significam
necessariamente que o modelo o mais adequado para reduo da aplicao de
penalidade, objetivo principal deste trabalho;
O modelo que apresentou o melhor MAPE no foi o que
apresentou os melhores resultados sob a tica da aplicao de penalidades;
Para o conjunto de dados analisado o que obteve a menor
aplicao de penalidade foi a rede neural artificial no auxiliada por sries temporais;
Entre os modelos propostos e analisados, visualmente percebe-se que o
modelo de rede neural artificial, auxiliada ou no por sries temporais, consegue
generalizar a dinmica da srie de consumo em estudo. Tanto a tendncia da srie,
quanto as oscilaes sazonais so absorvidas pelo modelo. Os ndices de desempenho,
assim como a aplicao de penalidades, revelam que o modelo apresenta bom
desempenho para previses de mdio prazo.
Para os consumidores do segmento GNV no ser possvel realizar um
comparativo entre os resultados obtidos com a metodologia aplicada atualmente na
companhia, pois esta, por sua vez, realizada a previso de consumo para o conjunto de
todos os consumidores do segmento e no para um consumidor especfico, conforme
explicado no captulo 1.

- 66 -

Captulo 6
6. Concluso
O presente trabalho permitiu constatar a possibilidade de melhorar de
forma significativa a previso de consumo de gs em mdio prazo utilizando tcnicas
como as redes neurais artificiais, as sries temporais e a combinao de ambas. A
metodologia do presente trabalho, utilizando estas tcnicas para realizao da previso
de consumo de gs natural nos segmentos industrial e GNV, bastante promissora,
trazendo vantagens em termos de versatilidade e maior preciso quando comparada a
tcnica usada atualmente na companhia.
Adicionalmente, tanto as redes neurais, como as sries temporais, ou a
associao de ambas aplicadas aos casos de estudo deste trabalho conseguiram melhores
ndices de acerto, quando comparadas com as tcnicas de regresso linear, polinomial,
logartmica e de potncia.
No tocante ao comparativo entre as tcnicas propostas, sejam elas
regresso, sries temporais e redes neurais artificiais, sendo esta ltima associada ou
no a tcnica de sries temporais, evidente que os melhores resultados so uma
combinao das caractersticas dos dados histricos do consumidor em anlise e a
tcnica que melhor modela os seus dados. Em outras palavras, no pode-se afirmar que
uma tcnica superior ou inferior sem antes analisar de forma minuciosa as
caractersticas da srie, tais como tendncias, sazonalidades, variaes irregulares e
randmicas.
Quando analisado o desempenho dos resultados frente aos objetivos
propostos foi possvel verificar a estreita relao entre o MAPE (mean absolute
percentage error) e a aplicao de penalidades, uma vez que para todos os casos as
previses com mnimos MAPEs correspondiam as menores penalidades.
O problema da programao diria exige um grande esforo de previso,
uma vez que devem ser previstos em torno de 14 valores no futuro, neste contexto foi
possvel verificar que o desempenho das redes neurais melhorou medida que foi
incrementado o nmero de entradas utilizando-se no apenas as do dia em questo, mas
tambm amostras do dia anterior. Alm disso, dois tipos de funes de disparo se
destacaram, principalmente, a funo sigmoide, e em menor grau a tangente hiperblica.

- 67 -

Outro objetivo proposto foi o desenvolvimento de uma ferramenta


computacional para realizao das previses. Com este intuito foi desenvolvida uma
ferramenta baseada em regresso, sries temporais e redes neurais artificiais que
permitem as seguintes atividades:

Banco de dados com os valores histricos para consumidores;


A visualizao dos perfis de consumo por consumidor;
A utilizao de diferentes tcnicas de regresso, sendo elas:
linear, polinomial, exponencial, logartmica e potncia;
A utilizao do modelo ARIMA de Box e Jenkins;
A utilizao do modelo de redes neurais artificiais Multilayer
Perceptron
com
aprendizado baseado
no algoritmo
backpropagation;
O clculo dos ndices de desempenhos apresentados no captulo
4;
Relatrio grfico comparativo de ajuste dos modelos

6.1 Sugestes para trabalhos futuros


Para continuidades deste trabalho, algumas propostas so sugeridas, tais
como:

Analisar outros fatores, que no a srie de consumo de gs


natural, que possam influenciar na previso de consumo de mdio prazo;

A utilizao de novas funes de ativao, de outras arquiteturas


de rede, assim como a utilizao de outros algoritmos de aprendizado;

A incorporao de sistemas especialistas aos modelos propostos;

A criao de um comit de preditores com os modelos propostos,


fazendo as ponderaes necessrias para aumentar a eficincia dos mesmos;

Realizar as adequaes necessrias aos modelos propostos para a


realizao de previses de curto e longo prazo;

A utilizao das tcnicas estudas na previso de outras variveis,


tais como: ndices de aes, condies climticas, etc.

- 68 -

Referncias Bibliogrficas
[ 1 ] GASNET. O site do gs natural. Distribuidoras de Gs. Disponvel em:
<http://www.gasnet.com.br> . Acessado em: 22 de novembro de 2011.
[ 2 ] MONTEIRO, J. V. FREITAS; SILVA, J. R. N. M. Gs Natural aplicado
indstria e ao grande comrcio. So Paulo: Blucher, 2010. 182p.
[ 3 ] AGNCIA NACIONAL DE PETRLEO, GS NATURAL E
BIOCOMBUSTIVIS ANP. Disponvel em: <http://www.anp.gov.br> .
Acessado em: 22 de novembro de 2011.
[ 4 ] KHOTANZAD, A; ELRAGAL, H; LU, T. L. Combination of artificial neuralnetwork forecasters for prediction of natural gas consumption. IEEE transactions
on neural networks / a publication of the IEEE Neural Networks Council, v. 11, n.
2, p. 464-73, jan 2000.
[ 5 ] AZZAM-UL-ASAR; MCDONALD, J. R. A Specification of Neural Network
Applications in the Load Forecasting Problem. IEEE TRANSACTIONS ON
CONTROL SYSTEMS TECHNOLOGY, v. 2, p. 135-141, out 1994.
[ 6 ] BROWN, R. H.; MATIN, I. Development of Artificial Neural Network Models
to Predict Daily Gas Consumption. Computer Engineering, p. 1389-1394, 1995.
[ 7 ] MOHAMMED, O. PARK, D. MERCHANT, R. et al. Practical Experiences
with An Adaptive Neural Network Short-Term Load Forecasting System The
Florida Power and Light ANN Architectures and Input. Forecast, v. 10, n. 1, p.
254-265, 1995.
[ 8 ] KHOTANZAD, A.; ELRAGAL, H. Natural Gas Load Forecasting with
Combination of Adaptive Neural Networks. Electrical Engineering, p. 4069-4072,
1999.
[ 9 ] PEHARDA, D.; DELIMAR, M.; LONEARIC, S. Short term hourly forecasting
of gas consumption using neural networks. Electrical Engineering, p. 367-371,
2001.
[ 10 ] VIET, N. H.; MANDZIUK, J. Neural and Fuzzy Neural Networks for Natural
Gas Consumption. Neural Networks, n. 503, p. 759-768, 2003.
[ 11 ] KIZILASLAN, R.; KARLIK, B. Comparison Neural Networks Models for Short
Term Forecasting of Natural Gas Consumption in Istanbul. Network, p. 448-453,
2008.
[ 12 ] XU, G.; WANG, W. Forecasting Chinas natural gas consumption based on a
combination model. Journal of Natural Gas Chemistry, v. 19, n. 5, p. 493-496, set
2010.
[ 13 ] ABREU, THAYS; ARAJO ,KLAYTON A. M.; LOPES, MARA L. M.;
LOTUFO, ANNA DIVA P. Metodologia Hbrida Utilizando os Modelos ARIMA e

- 69 -

Redes Neurais Artificiais para Previso de Cargas Eltricas. Congresso Brasileiro


de Automtica, p. 2229-2236, 2012.
[ 14 ] RUI, C. JIAN, W. LI, W. NINGJIE, Y.; PENGYAN, Z. The Forecasting of
China Natural Gas Consumption Based on Genetic Algorithm. 2009 Fifth
International Joint Conference on INC, IMS and IDC, n. 0, p. 1436-1439, 2009.
[ 15 ] HUA, F.; FENG, W. Based on Kalman Filtering Theory Gas Forecast System
Research. 2010 Third International Conference on Information and Computing, p.
69-72, jun 2010.
[ 16 ] CHIU, S.; TAVELLA, D. Data Mining And Market Intelligence For Optimal
Marketing Returns. Oxford: Butterworth-Heinemann, 2008.
[ 17 ] HAN, J.; KAMBER, M. Data Mining Concepts and Techniques. San Diego:
Academic Press, 2001.
[ 18 ] SNEDECOR, G. W.; COCHRAN W. G. Statistical methods. 8th ed. Iowa: Iowa
State University Press, 1989.
[ 19 ] MILONE, Giuseppe; ANGELINI, Flvio. Estatstica Aplicada. So Paulo:
Atlas, 1995.
[ 20 ] RIBEIRO; Luiz Cludio; PAULA, Anaparecida Vieira. Previso de populao
atravs dos modelos ARIMA de Box e Jenkins, 2000 In: Encontro Nacional de
Estudos Populacionais, Anais...: Universidade Federal de Minas Gerais, Caxambu,
2000. Disponvel em: http://www.abep.nepo.unicamp.br/docs/anais/pdf/2000.
[ 21 ] SFADI, Thelma; NOGUEIRA, Denismar Alves. Previso de preos na
bovinocultura de corte. Revista de Administrao da UFLA v. 2, n. 1, p. 22-31,
2000.
[ 22 ] MAKRIDAKIS, Spyros G.; WHEELWRIGHT, Steven C; HYNDMAN, Rob J.
Forecasting: methods and applications. 3.ed. New York: John Wiley & Sons,
1998.
[ 23 ] FONSECA, Jairo S.; MARTINS, Gilberto A.; TOLEDO, Geraldo L. Estatstica
Aplicada. So Paulo: Atlas, 1995.
[ 24 ] TUBINO, Dalvio F. Manual de Planejamento e Controle da Produo. 2.ed.
So Paulo: Atlas S.A., 2000
[ 25 ] MENTZER, John T.; BIENSTOCK, Carol C. Sales Forecasting Management.
Thousand Oaks: Sage, 1998.
[ 26 ] MORETTIN, Pedro Alberto; TOLOI, Cllia M. Sries Temporais. 2.ed. So
Paulo: Atual, 1987.
[ 27 ] MORETTIN, Pedro Alberto; TOLOI, Cllia M. Anlise de sries temporais. So
Paulo: Edgard Blucher, 2004.
[ 28 ] BRYSON JR, A. E.; HO, Y. C. Applied Optimal Control. Washington:
Hemisphere Publishing Company Corporation, 1975.
[ 29 ] STENGEL, Robert F. Stochastic Optimal Control: Theory and Application.
1.ed. New York: John Wiley & Sons Inc, 1986.
[ 30 ] SFADI, Thelma. Uso de sries temporais na anlise de vazo de gua na
represa de FURNAS. Cincias Agrotcnicas, Lavras, v.28, n.1, p. 142-148. 2004.
[ 31 ] BOX, G. E. P., JENKINS, G. M & REINSEL, G. C. Time Series Analysis
Forecasting And Control. 3.ed. New Jersey: Prentice Hall, 1994.
- 70 -

[ 32 ] PELLEGRINI; Fernando R.; FOGLIATTO, Flvio S.; Passos para


Implementao de Sistemas de previso de Demanda Tcnicas e Estudo de Caso.
Revista PRODUO, v.11, n.1, Novembro de 2001.
[ 33 ] VASCONCELLOS, M. A. S.; ALVES, D. Manual de Econometria. So Paulo:
Atlas. 2000.
[ 34 ] GUJARATI, D. N. Econometria Bsica. So Paulo: Makron Books, 2004.
[ 35 ] ROJAS, R. Neural Networks. Neural Networks, v. 42, n. A.I. Memo No. 1562, p.
509, 1996. Springer.
[ 36 ] HAYKIN, S. Redes Neurais Princpios e Prticas. 2. ed. Porto Alegre:
Bookman, 2001.
[ 37 ] BRAGA, A. P.; CARVALHO, A. C. P. L. F.; LUDERMIR, T. B. Redes neurais
artificiais: teoria e aplicaes. Rio de Janeiro: LTC, 2000.
[ 38 ] THEIL, H. Economic forecasts and policy. North-Holland Publishing Co., 1958.

- 71 -

Apndice A - Ferramenta
Computacional
Nesta seo sero apresentadas as funcionalidades implementadas na
ferramenta computacional, assim como o diagrama funcional, estrutura das telas e
forma de utilizao.

A-1 Apresentao
Na Figura A.2 encontram-se representado o diagrama funcional da
ferramenta computacional, no qual observa-se a diviso da ferramenta em basicamente
duas etapas: cadastramento de consumidores e configurao dos modelos de previso.

A-2 Banco de dados


Na etapa de cadastramento de consumidores realizada a identificao
do consumidor por intermdio de dados cadastrais triviais, tais como: nome, logradouro,
municpio e CNPJ, destacando-se a informao referente ao segmento ao qual ele
pertence.

Figura A.1 Tela de acesso ao banco de dados dos consumidores


- 72 -

Incio

Seleo da funcionalidade
desejada

Cadastramento de
Consumidores

Configurao dos modelos


de previso

Cadastro de dados de
identificao do
consumidor

Seleo do consumidor

Avaliao dos perfis


de consumo

Carga dos dados de


consumo
Ajuste e validao
dos modelos de
Regresso

Armazenamento dos dados


de consumo

Ajuste e validao
dos modelos de
Sries Temporais

Trmino

Ajuste e validao
dos modelos de
Redes Neurais

Anlise da aplicao
de penalidades

Trmino

Figura A.2 Diagrama funcional da fermenta computacional

- 73 -

No tocante aos dados histricos de consumo, estes so carregados de


forma automatizada na ferramenta por intermdio de arquivos padronizados no formato
Microsoft Excel, conforme modelo demonstrado na figura A.3.

Figura A.3 Exemplo de arquivo padronizado de entrada

A-3 Configurao dos modelos de previso


Uma vez cadastrado os consumidores, segue-se para etapa de
configurao dos modelos, que foi dividida em cinco processos: avaliao dos perfis de
consumo, ajuste e validao dos modelos de Regresso, ajuste de validao dos
modelos de Sries Temporais, ajuste e validao dos modelos de Redes Neurais
Artificiais e anlise da aplicao de penalidades.

A-3.1 Avaliao dos perfil de consumo


O primeiro processo, chamado de avaliao dos perfis de consumo,
consiste em observar e avaliar os perfis de consumo de forma individualizada, por
intermdio dos consumos mdios, mximos e mnimos, segmentados em horrio,
semanal, dirio e mensal, a fim de obter caractersticas tpicas como tendncias,
sazonalidades, variaes irregulares e randmicas, de fundamental importncia no
ajuste dos modelos que seguem.
O banco de dados ir fornecer os dados necessrios para realizao desta
anlise, podendo-se selecionar o perodo no qual se deseja realizar esta operao.

- 74 -

Na figura A.4 apresentada a tela da ferramenta referente ao perfil de


consumo horrio de um consumidor do segmento veicular, no qual destaca-se um perfil
com caractersticas sazonais.

Figura A.4 Exemplo de perfil de consumo


Outra informao importante para a realizao das previses de consumo
obtida neste processo, chamado de Fator de Escala, ou seja, um valor numrico que
servir para normalizar os dados nos prximos processos.

A-3.2 Ajuste e validao dos modelos de Regresso


No processo de ajuste e validao dos modelos de regresso sero
realizados os ajustes das curvas de regresso linear, polinomial, exponencial,
logartmica e potncia, cabendo ao usurio da ferramenta apenas selecionar o perodo
desejado para esta tarefa. Os ajustes sero realizados e exibidos graficamente conforme
figura A.5.

- 75 -

Com o intuito de avaliar os resultados obtidos, nesta mesma tela sero


exibidos os ndices de desempenho, destacando em verde os melhores ndices e em
vermelho os piores.

Figura A.5 Exemplo de ajuste e validao dos modelos de regresso


Do ponto de vista do grfico apresentado possvel ajustar os limites
mximo e mnimo de tolerncia para aplicao de penalidades, devendo a curva prevista
manter-se dentro destes limites, evitando assim a aplicao de penalidades.

A-3.3 Ajuste e validao dos modelos de Sries Temporais


O processo de ajuste e validao dos modelos de Sries Temporais
iniciado com a seleo do perodo de ajuste, seguida pela anlise da srie temporal,
observando-se as funes de autocorrelao e autocorrelao parcial, exemplificada na
figura A.6.

- 76 -

De posse das observaes realizadas faz-se a escolha da ordem dos


processos auto-regressivo (p) e mdio mvel (q), assim como a quantidade de
diferenciaes necessrias (d), finalizando com a escolha dos atrasos (lags)

Figura A.6 Exemplo de anlise da srie temporal


Configurado o modelo desejado parte-se para o ajuste, cujo resultado
exibido graficamente, conforme figura A.7, onde destaca-se a necessidade de analisar,
alm do ajuste propriamente, o erro e a autocorrelao do erro.
Uma vez considerado ajustado o modelo parte-se para a validao do
mesmo, no qual deve-se escolher um perodo, chamado perodo de validao e mais
uma vez analisar o erro e a autocorrelao do erro, conforme figura A.8
O processo finalizado avaliando os ndices de desempenho,
apresentados em forma de tabela.

- 77 -

Figura A.7 Exemplo de ajuste do modelo de srie temporal

Figura A.8 Exemplo de validao do modelo de srie temporal


- 78 -

A-3.4 Ajuste e validao dos modelos de redes neurais artificiais


Este processo, ajuste e validao dos modelos de redes neurais artificiais,
iniciado pela seleo do perodo de aprendizado da rede neural artificial, seguido pela
caracterizao desta etapa, em que sero escolhidos o nmero de ciclos de aprendizado,
a razo de aprendizado , o erro mdio mximo admissvel, utilizado como critrio de
parada, alm do fator de momento, elemento facilitador da convergncia do
aprendizado.
Terminada a configurao do aprendizado, segue-se para a topologia da
rede, na qual sero definidos o nmero de camadas escondidas, o nmero de neurnios
por camada escondida e a funo de ativao, para este ltimo foram implementadas
duas funes, a tangente hiperblica e a sigmoide. Na figura A.9 exemplificada esta
etapa.
No tocante as entradas e sadas da rede neural artificial, pode-se
configur-las com ou sem o auxlio de sries temporais, alm da possibilidade de
incluso do vetor codificado dos dias da semana.

Figura A.8 Exemplo de aprendizado da rede neural artificial

- 79 -

Durante o andamento do processo de aprendizado exibida, em tempo


real e na forma grfica, a evoluo do erro mdio de mximo de aprendizado, na qual
observa-se a convergncia do modelo para o mnimo global, facultando ao usurio
continuar ou no o corrente aprendizado.
Concluda a etapa de aprendizado, inicia-se, com a seleo do perodo de
validao do modelo, a etapa de anlise de adequao do modelo a srie em estudo,
conforme figura A.9, na qual sero observados os valores previstos frente aos valores
reais, respeitando-se os limites de tolerncia para aplicao de penalidades.

Figura A.9 Exemplo de validao do modelo de rede neural artificial


O processo finalizado avaliando os ndices de desempenho,
apresentados em forma de tabela.

- 80 -

A-3.5 Anlise da aplicao de penalidades


O ltimo processo a ser realizado a anlise da aplicao de penalidades,
no qual, para cada uma das tcnicas de previso, sero observados o erro percentual da
previso e a aplicao de penalidade por exceder os limites superior e inferior.
Na figura A.10 apresentada a tela da ferramenta referente anlise da
aplicao de penalidade, onde observa-se, graficamente, o erro percentual e a aplicao
de penalidades e, na forma de tabela, o resultado consolidado do modelo de previso,
com o percentual de acertos, de erros e de aplicao de penalidades para o perodo
selecionado para anlise.

Figura A.10 Exemplo de anlise da aplicao de penalidades

- 81 -

Vous aimerez peut-être aussi