Vous êtes sur la page 1sur 14

ISSN 0101-7438

COOPERAO ENTRE REDES NEURAIS ARTIFICIAIS E TCNICAS CLSSICAS PARA PREVISO DE DEMANDA DE UMA SRIE DE VENDAS DE CERVEJA NA AUSTRLIA Guilherme Marques Calba * EP/COPPE Universidade Federal do Rio de Janeiro Rio de Janeiro RJ E-mail: gcaloba@mail.com Luiz Pereira Calba EP/COPPE Universidade Federal do Rio de Janeiro Rio de Janeiro RJ Eduardo Saliby COPPEAD Universidade Federal do Rio de Janeiro Rio de Janeiro RJ
* Corresponding author /autor para quem as correspondncias devem ser encaminhadas

Recebido em 07/2002, aceito em 12/2002 aps 1 reviso

Resumo
O principal objetivo deste trabalho avaliar a complementao do uso de tcnicas de previso de vendas com Redes Neurais Artificiais. Como aplicao, foi analisada a demanda industrial no setor de cerveja da Austrlia. A maioria dos modelos de previso atuam de forma isolada, ou seja, tratando problemas por enfoques que se excluem. A sugesto deste trabalho utilizar estes mtodos de forma cooperativa, buscando alcanar melhores resultados que aqueles obtidos individualmente. O trabalho inicia-se com consideraes sobre previses de sries temporais, caracterizao breve sobre redes neurais e outros mtodos de previso. A seguir, o estudo de caso: uma srie histrica de vendas de cerveja na Austrlia. Encerra-se com uma concluso e recomendaes, e lista de referncias bibliogrficas.

Palavras-chave: previso de demanda, redes neurais artificiais, cooperao. Abstract


The main goal of this article is to evaluate the complementation between forecasting techniques, in particular Neural Networks. The environment of the application is a foreign industrial sector, sales of beer in Australia. Most of the forecasting models act in a separate way, that is, treating problems through different views that exclude one another. The suggestion of this work is to use the methods in a cooperative way, looking forward to achieve better results. The article begins with some considerations on Time Series Studies, followed by a brief characterization of Neural Networks and the other methods used on this work. Continuing, the case is presented and discussed and finishing, conclusions and a list of references.

Keywords: demand forecasting, artificial neural networks, cooperation.

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

345

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

1. Introduo O principal objetivo deste artigo avaliar a complementao do uso de tcnicas de previso de vendas mais conhecidas com outras menos difundidas, em particular Redes Neurais Artificiais. Dado que existe um planejamento em uma organizao, quer empresa ou pas, existe espao para uma previso de demanda. A maioria das organizaes existe para servir ao consumidor, em suas mais diversas formas. Prever a demanda significa estimar a resposta do consumidor e planejar medidas para atender estas necessidades. Este trabalho buscou combinar tcnicas lineares e no-lineares para a melhor previso de demanda, obtendo resultados positivos e interessantes na cooperao destas tcnicas. 2. Consideraes sobre Previso de Sries Temporais Todo problema de previso possui uma metodologia prpria de resoluo. Neste trabalho, sero utilizadas algumas caractersticas e definies particulares. Para se ter uma idia do quanto uma previso precisa, necessrio haver uma forma de estimar o quanto se est errando, em mdia. Estes valores de impreciso geralmente se originam da Estatstica, como ilustrado, por exemplo, em Wonnacott & Wonnacott (1990). Este erro calculado de duas formas distintas neste presente trabalho: a) Erro Mdio Percentual (MAPE): Consiste na seguinte expresso:
MAPE = 1

( N ). (y y ) y
N i =1 i pi

(1)

onde yi o valor real do perodo i; ypi a previso para o perodo i e N o nmero de perodos no conjunto de validao. b) Raiz do Erro Mdio Quadrtico Percentual (REMQP): Consiste no clculo do desvio padro percentual observado, segundo a frmula:
N REMQP = 1 . y i y pi N i =1

( ) [(

)y]
2 i

(2)

onde yi o valor real do perodo i; ypi a previso para o perodo i e N o nmero de perodos no conjunto de validao. No restante deste trabalho, a raiz do erro mdio quadrtico percentual ser denotada como EMQP. Foram utilizados neste trabalho dois mtodos de previso clssica, a saber: a regresso mltipla e a decomposio clssica, incluindo clculo de tendncia, sazonalidade aditiva e remoo de ciclos por anlise de freqncia (Transformada de Fourier).

346

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

3. Caracterizao das Redes Neurais Utilizadas no Trabalho A rede utilizada neste trabalho do tipo feedforward. Esse um tipo de rede j bastante conhecido e experimentado, e o mais largamente utilizado atualmente. Em redes do tipo feedforward os neurnios so dispostos em camadas, usualmente duas camadas ativas. Os neurnios de uma camada s se conectam com os da camada subseqente. Pode ser destacada na estrutura de uma rede desse gnero 3 tipos de camadas. A primeira camada, ou camada de entrada, no composta por neurnios, mas simplesmente pelas conexes dos sinais de entrada. A camada seguinte, conhecida como camada intermediria ou camada escondida, composta por N neurnios, e realiza algumas transformaes. Ao fim existe uma camada conhecida como camada de sada. Existem tantos neurnios nessa camada quanto o nmero de sadas desejadas, cada sada representando uma varivel que se deseja prever. A seguir tem-se a figura 1 representa uma rede do tipo feedforward hipottica, apresentando n entradas, uma nica camada intermediria, com Q neurnios e m neurnios na camada de sada.
Entradas 1 x1 Camada Intermediria 1 1
i i i

. . . . . .

Camada de Sada

Sadas y1

xj

i
i i i i i i

i i i

xn

ym

Figura 1 Rede neural feedforward de duas camadas

Prova-se que a rede neural com duas camadas de neurnios possui a capacidade de realizar qualquer mapeamento entrada-sada desejado, desde que unvoco, e desde que o nmero de neurnios na camada intermediria seja suficiente, como cita, por exemplo, Hecht-Nielsen (1990). 3.1 Conjuntos de Teste, Treinamento e Validao Em qualquer problema a ser resolvido atravs do uso de redes neurais, necessrio o uso de pares de entrada-sada j conhecidos. Muitas vezes a quantidade de pares disponveis no muito grande, mesmo assim deve-se separar esses dados em dois conjuntos bem definidos, o conjunto de treinamento e o conjunto de teste. O treinamento da rede feito utilizando o conjunto de treinamento. , entretanto, necessrio medir a performance da rede, considerando como ela responde a pares entrada-sada no apresentados durante o treinamento (o conjunto de teste). Isso importante pois um treinamento prolongado demais gera um problema conhecido como overtraining, que pode levar a uma super especializao da rede (principalmente quando se dispe de muito poucos dados) e a uma perda da capacidade da rede de responder bem a dados nunca apresentados (perda da capacidade de generalizao). A figura a seguir mostra claramente a evoluo tpica do erro de uma rede ao longo do processo de treinamento, tanto do erro do conjunto de treinamento como do conjunto de teste. A partir de um certo nmero

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

347

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

de passos, a performance do conjunto de teste pra de decair e comea a piorar, mesmo que a do conjunto de treinamento continue decaindo. Inicia-se a super especializao. virtualmente aceito que a melhor rede aquela que fornece o menor erro no conjunto de validao (definido a seguir) aquela que fornece o mnimo erro para o conjunto de teste.
Erros x No de passos de treinamento
1,6 Erro de treinamento 1,2 Erro de teste

0,8

0,4

0 500

1500

2500

3500

4500

5500

Figura 2 Evoluo do erro durante o treinamento

O conjunto de validao corresponde a pares entrada-sada que no so apresentados rede durante o treinamento e no so parmetro para encerrar o treinamento, ou seja, representam um conjunto totalmente novo a ser apresentado rede para avaliao de desempenho. 4. Estudo de Previso de Vendas: Vendas de Cerveja na Austrlia Este trabalho contempla a previso comparativa em produo de cerveja na Austrlia. Desta forma, a exemplificao dos mtodos e sua comparao nos casos especficos mostra-se de forma mais clara. A proposta do trabalho utilizar primeiramente os mtodos clssicos de previso e, em seguida, a Rede Neural. A srie utilizada para este exemplo consiste em observaes da produo de cerveja, em megalitros, em todo o territrio da Austrlia. Baseado em uma srie de mais de quarenta anos, se partiu para a previso dos 20 ltimos meses. A seguir, a srie de vendas.
Produo mensal de cerveja na Austrlia: Ml (Megalitros)
250 200 150 100 50 0
Ja n56 Ja n59 Ja n62 Ja n65 Ja n68 Ja n71 Ja n74 Ja n77 Ja n80 Ja n83 Ja n86 Ja n89 Ja n92 Ja n95

Ms

Figura 3 Srie de Vendas de Cerveja na Austrlia

348

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Esta srie possui sazonalidade muito marcante, o que leva a crer que um mtodo como a decomposio consiga alcanar um resultado satisfatrio no tratamento. O estudo de componentes de ciclo e de tendncia deve conduzir a um resultado ainda melhor. Dado o fato que a srie muito longa e possui uma tendncia que se modifica claramente aproximadamente em sua metade, foi utilizada para previso apenas informaes de 1976 em diante, o que ainda fornece uma gigantesca base de dados, em comparao ao que geralmente disponvel para previses. Esta separao est denotada pela linha vertical no meio do grfico (ver figura 3). 4.1 Tratamento Estatstico Convencional Inicialmente, utilizando o mtodo dos mnimos quadrados, foi estimada a reta de tendncia para os pontos da srie. Esta reta a melhor estimativa linear do conjunto de pontos. Estes pontos foram numerados de 1 a 216, variando desde o ms de janeiro de 1976 at agosto de 1995. A retirada de tendncia gerou a seguinte distribuio grfica para os pontos:

Resduo Aproxim ao Linear 80

60

40

20 Valor

0 1 9 17 25 33 41 49 57 65 73 81 89 97 105 113 121 129 137 145 153 161 169 177 185 193 201 209

-20

-40

-60 Perodo

Figura 4 Resduo aps retirada de nvel e tendncia

A eliminao da tendncia conseguiu reduzir bem a disperso dos pontos, levando a um somatrio quadrado do resduo bem menor. A raiz quadrada da mdia dos quadrados dos resduos, que era de 159, passou a ser 21, mostrando que a reta em questo explica estatisticamente parte do modelo. Esta estatstica (raiz quadrada da mdia dos quadrados dos resduos) ser denotada deste ponto em diante apenas como resduo. Verifica-se, no estudo da sazonalidade aditiva, um padro com uma queda no meio do ano, com uma tendncia de maior consumo no vero (final do ano), o que parece uma tendncia bastante razovel. O padro sazonal, representando o quanto acima ou abaixo da mdia anual cada ms est, em mdia, pode ser visto abaixo, descriminado para cada ms do ano.

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

349

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Padro Sazonal
50 40 30 20 Valor 10 0 -10 -20 -30 Ms Jan Fev Mar Apr Mai Jun Jul Ago Set Out Nov Dez

Figura 5 Padro Sazonal

Uma vez subtrados os padres sazonais srie, esta tomou a seguinte distribuio:

Resduo sem Sazonalidade (12) 50 40 30 20 10 0 1 -10 -20 -30 -40 -50 9 17 25 33 41 49 57 65 73 81 89 97 105 113 121 129 137 145 153 161 169 177 185 193 201 209

Figura 6 Resduo aps retirada de sazonalidade anual

Houve, novamente, queda do resduo, para 11,44. Em muitos estudos, a decomposio da srie se encerraria neste ponto. Neste caso, no entanto, buscou-se refinar a anlise atravs do estudo de ciclos, viabilizando a possvel eliminao de sazonalidades no inteiras dentro do espectro e tambm de padres cclicos muito longos, no tratveis pelo estudo clssico de sazonalidade. A anlise de Fourier da srie indicou o seguinte periodograma, no qual aparecem em destaque os valores com maiores picos de sazonalidade.

350

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Anlise Espectral: Cerveja sem Sazonalidade Pontos Analisados: 216 5000 4000 3000 2000 1000 0 5000 4000 3000 2000 1000 0 0.5
5000 4000 3000 2000 1000 0

Anlise Espectral: Cerveja sem Sazonalidade Pontos Analisados: 216 5000 4000 3000 2000 1000 0 220

Valores do Periodogram a

Valores do Periodogram a

0.05

0.1

0.15

0.2

0.25 Freqncia

0.3

0.35

0.4

0.45

20

40

60

80

100

120

140

160

180

200

Perodo

Figura 7 Periodograma para a srie desazonalizada da cerveja

Dois picos de sazonalidade foram estudados: o primeiro, com uma freqncia bem alta, de perodo 2,88, e outro sendo um ciclo de metade da srie, perodo 108 (pontos com destaque na figura 7). necessrio ter muito cuidado no tratamento de ciclo dentro da srie, pois alterando perodos muito curtos, pode se introduzir componentes instveis, levando a problemas na anlise. Foi o que ocorreu no tratamento da componente de perodo 2,88. Neste caso, o desvio padro dos resduos, que valia 11,44, passou a ser de 13,26, devido introduo de componentes no desejadas no espectro. A componente removida a princpio foi a de perodo maior, cuja freqncia igual a 0,0093. Seu coeficiente de seno igual a 0,4605 e o do cosseno 4,6958. Esta componente foi removida da forma descrita anteriormente, atravs da funo dada pelos coeficientes e pela freqncia. Aps este tratamento desta componente, encontrou-se a seguinte distribuio para os pontos da srie:
40 30 20 10 0 1 -10 -20 -30 -40 10 19 28 37 46 55 64 73 82 91 100 109 118 127 136 145 154 163 172 181 190 199 208

Figura 8 Srie aps retirada da componente de freqncia baixa

Aps este tratamento, o resduo caiu novamente para 10,95. importante ressaltar o fato de que apesar desta queda de resduo no ser to significante, no tratamento posterior do problema atravs das redes neurais, fundamental. O periodograma da srie est exposto na prxima figura:

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

351

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Anlise Espectral: Cerveja Retirada Com p freq m enor Pontos Analisados: 216 5000 4000 3000 2000 1000 0 5000 4000 3000 2000 1000 0 0.5

Valores do Periodogram a

0.05

0.1

0.15

0.2

0.25 Freqncia

0.3

0.35

0.4

0.45

Figura 9 Periodograma da Srie aps retirada da componente de freqncia menor

Verifica-se que a componente de menor freqncia teve seu sinal totalmente eliminado. A componente de freqncia maior, 0,34722, no entanto, no foi removida neste passo. Ao ser removida, a componente aparecia novamente no novo espectro, ainda maior. Observando mais cuidadosamente a figura 9, observa-se a presena de uma outra componente com valor espectral elevado, de freqncia pouco acima da componente de maior pico. A hiptese levantada foi de que a componente com valor espectral alto era, na verdade, uma componente intermediria. O embasamento terico para isso que, como observado em Chatfield (1989), a anlise FFT possui limitaes em preciso. S podem ser representadas por esta anlise componentes cujo perodo pertena ao conjunto n/i, onde n o nmero de valores observados na srie e i um nmero inteiro, variando de 1 a n/2. Encontrou-se, no entanto, uma forma de contornar o problema: atravs de uma otimizao realizada com o objetivo de minimizar a soma do resduo. No caso, a previso se daria pela soma de tendncia, sazonalidade e da componente de freqncia menor, j retirada anteriormente. O otimizador variou coeficiente de senos, cossenos e freqncia, procurando minimizar o resduo. A nica condio de contorno inserida foi para a freqncia, que deveria se localizar entre 0,34722 e 0,351851, os dois picos observados no periodograma. Aps algumas iteraes, encontrou-se a = 0,1678, b = 0,0705 e = 0,34858. O valor observado para a funo objetivo (resduo) foi reduzido para = 9,6659, j multiplicado por 40 (escala original). A prova final do sucesso desta otimizao foi dado pela anlise espectral est na figura a seguir:
Anlise Espectral: Srie Otimizada Pontos Analisados: 216 0.7 0.6 Valores do Periodograma 0.5 0.4 0.3 0.2 0.1 0 -0.1 0 0.05 0.1 0.15 0.2 0.25 Freqncia 0.3 0.35 0.4 0.45 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -0.1 0.5

Figura 10 Periodograma da Srie aps retirada da componente otimizada

352

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Todos os valores de densidade espectral esto em uma mesma ordem de grandeza. Neste instante, pode-se dizer que o tratamento de ciclo se encerrou. Uma vez encerrado o tratamento da srie pela decomposio, possvel executar a previso dos 20 pontos reservados validao para este exemplo. Este previso feita atravs da extenso da reta de tendncia, somada ao ndice sazonal para cada ms e s componentes de ciclo, tambm extrapoladas para o ms corrente. Os resultados a cada passo de previso foram os seguintes:
Tabela 1 Tabela comparativa de erros Erros na Previso EMQP Decomposio Clssica Dec.Cls + CFm* Dec.Cls + CFm + CFM**
* Componente de Freqncia Menor ** Componente de Freqncia Maior

MAPE

8,065% 6,930% 5,758%

7,159% 6,107% 5,049%

Nesta tabela, a primeira linha exibe os erros pela previso utilizando apenas sazonalidade e tendncia; a segunda linha representa o uso adicional da srie de freqncia mais baixa; e a terceira, o acrscimo da componente interpolada de freqncia maior. O grfico abaixo mostra a comparao entre o que foi previsto pela decomposio e os dados reais.
Decomposio Clssica
200 190 180 170 160 150 140 130 120 110 100 Feb-94 Mar-94 Oct-94 Feb-95 May-94 Mar-95 Apr-94 Apr-95 May-95 Jul-94 Sep-94 Nov-94 Dec-94 Jan-94 Jun-94 Jan-95 Aug-94 Jun-95 Jul-95 Aug-95

Valores

Meses Real Tend.,Sazon. Tend.,Sazon.,CFm Tend.,Sazon.,CFm.,CFM.

Figura 11 Comparao entre previsto e realizado Decomposio

4.2 Redes Neurais Como j foi exposto anteriormente, foram utilizados na previso atravs de Redes Neurais os valores da srie aps a retirada de tendncia, sazonalidade e ciclo. Esta deciso foi tomada por deixar para a rede apenas o problema de identificar padres no-lineares, o que esta vai

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

353

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

fazer melhor atravs de dados cujos padres lineares j tenham sido excludos. Desta forma, a rede vai tratar a no-linearidade, deixando para os mtodos clssicos as componentes lineares. Esta propriedade das redes neurais artificiais salientada por Calba (1988), Wasserman (1989) e Haykin (1999). O ponto de partida para utilizao da rede foi a preparao dos pontos para entrada na rede. Inicialmente, todos os valores devem estar numa escala entre 1 e 1. Isto se d porque a funo de ativao dos neurnios utilizada foi a tangente hiperblica, que possui seu intervalo mais significativo de variao entre 1 e 1. Valores neste intervalo contribuem mais para o treinamento. A seguir, foi feito estudo de autocorrelao da srie, utilizando pacote de software estatstico. Atravs deste grfico, podem ser identificados os meses que mais esto correlacionados com o valor atual da srie. As linhas verticais correspondem a dois desvios padres da correlao de uma srie randmica, ou seja, pontos com correlao superior tem nvel de significncia menor que 5% para a hiptese de ausncia de correlao. Como resultado, apresentou-se o grfico abaixo:
Autocorrelao Vendas de Cerveja (Confiana de 95% )

Atraso
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 -0.3

-0.2

-0.1

0.1

0.2

0.3

Figura 12 Autocorrelao da Srie Decomposta

No grfico, a abscissa representa a escala das autocorrelaes, enquanto a escala vertical identifica, para as barras apresentadas, os meses de atraso com relao srie principal, ou seja, a defasagem da autocorrelao calculada. Trs valores mostram-se particularmente interessantes: as vendas defasadas de 11, 38 e 50 meses possuem uma correlao acima do limite de confiana da srie randmica. Alm disto, existe um efeito combinado possvel entre os meses 2 e 3, com correlaes quase no limite de significncia, e no mesmo sentido. Este efeito combinado poder trazer alguma contribuio significativa.

354

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Assim, para cada ponto de treinamento, teste e validao, haver trs pontos de entrada, que sero estes valores atrasados da srie. atravs destes valores que deve ser reconhecido o padro da srie. Logo que forem separados os pares de treinamento e teste, cuja abscissa so os trs valores atrasados de vendas e a ordenada o valor a ser previsto, a rede j est praticamente pronta para ser utilizada. 4.2.1 Seleo de Arquitetura e Treinamento da Rede Para este caso, em cada ano do perodo de treinamento e teste, foram selecionados randomicamente 4 pontos de teste e oito de treinamento, sem meses pr-determinados para teste ou treinamento. A tentativa que os conjuntos de teste e treinamento sejam ambos assemelhados ao padro da srie, homogneos tanto com relao aos meses do ano quanto com os anos utilizados. Isto gerou um conjunto de 110 pontos de treinamento, 56 de teste e 20 de validao. Uma vez selecionados os conjuntos de treinamento e teste, falta apenas definir a arquitetura da rede a ser utilizada. Isto consiste em determinar parmetros como a taxa de treinamento e a quantidade de neurnios na camada intermediria. A taxa utilizada foi de 0,001, baixo o suficiente para evitar divergncia. Como o mtodo de treinamento por lote, no deve se ter receio de convergncias muito lentas. A determinao do nmero de neurnios na camada intermediria no pode ser feita sem alguma experimentao. O uso de poucos neurnios na camada intermediria leva a uma capacidade de generalizao maior, mas pode estar simplificando demais o modelo. J o uso de muitos neurnios pode introduzir uma complexidade que o problema no possui, e fazer com que a rede fique muito restrita, e propensa a overtraining. 4.2.2 Treinando e Testando a Rede Neural Seguindo ao pr-processamento, comearam as experincias com a rede propriamente dita. Foram utilizados as sries atrasadas 2, 3, 11, 38 e 50 meses, seguindo uma ordem lgica de descarte de piores resultados, como segue abaixo. Para cada experincia, necessrio procurar a melhor configurao, ou seja, no caso descrito, testar diversos nmeros de neurnios na camada intermediria. A primeira aplicao realizada utilizou apenas os dados de vendas 2 e 3 meses antes do valor a ser previsto. Iniciou-se assim pois estas so as entradas que possuem menor correlao. O melhor resultado obtido foi com 2 neurnios na camada intermediria, alcanando MAPE de 5,01% e EMQP de 5,71%. A seguir, agregou-se a essa configurao a srie atrasada de 11 meses. Para esta experincia, com 2 neurnios, o MAPE desceu para 4,92% e o EMQP subiu para 5,73%. H indcios, ento, que a insero da srie com defasagem de 11 meses pode trazer benefcios previso. De modo a esclarecer as dvidas, a rede foi treinada apenas com a entrada de 11 meses atrasados. O melhor resultado obtido foi com 3 neurnios: MAPE de 4,86% e EMQP de 5,54%. Assim, descartaram-se as entradas de 2 e 3 meses. Anexaram-se as correlaes mais fortes, 38 e 50 meses defasadas, e novamente foram testadas diversas redes, com nmeros distintos

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

355

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

de neurnios. O melhor resultado se deu para 6 neurnios na camada intermediria, alcanando MAPE de 4,50% e EMQP de 5,23%. Este foi o melhor resultado encontrado empregando-se a rede neural. O grfico a seguir mostra o comportamento dos erros durante o treinamento no caso timo, no qual no ocorreu validao cruzada:

Evoluo dos Erros


0.1 0.08 EMQ 0.06 0.04 0.02 0 0 10000 20000 30000 40000 50000 pocas Teste Treino Validao 60000 70000 80000 90000 100000

Figura 13 Evoluo dos Erros no Treinamento com 6 Neurnios na camada intermediria

4.3 Anlise de Resultados Adicionalmente decomposio clssica e as Redes Neurais, foi utilizado o mtodo do amortecimento exponencial triplo, tambm conhecimento como amortecimento de HoltWinters, detalhado, por exemplo, em Moretttin & Toloi (1987), que considerado um bom mtodo de previso de sries e foi aplicado de forma isolada. A seguir, uma tabela comparativa com os resultados dos mtodos:
Tabela 2 Comparao dos Mtodos de Previso Erros na Previso EMQP Decomposio Clssica Dec.Cls + CFm Dec.Cls + CFm + CFM Holt-Winters Redes Neurais (11,38,50) n=6, =0.001 MAPE

8,06% 6,93% 5,76% 6,94% 5,23%

7,16% 6,11% 5,05% 5,25% 4,50%

Como observvel, a Rede Neural complementou de forma positiva a decomposio, chegando a resultados mais precisos que seu uso isolado. Encontrou-se no s menor mdia de erro, mas tambm desvio-padro mais reduzido. Abaixo exposto um grfico com a comparao dos pontos reais e os pontos previstos pela rede neural, bem como pelos outros mtodos aplicados.

356

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

Comparao Previso
200 190 180 170 160 150 140 130 120 110 100 Apr-94 Oct-94 May-94 Apr-95 May-95 Feb-94 Feb-95 Mar-94 Aug-94 Nov-94 Dec-94 Mar-95 Jan-94 Jun-94 Jan-95 Jun-95 Aug-95 Sep-94 Jul-94 Jul-95

Previso (hectolitros)

Meses Decomposio Clssica Holt Winter(n=6) Rede Neural Real

Figura 14 Comparao de resultados obtidos pelos diversos mtodos na previso

5. Concluses A srie de vendas de cerveja foi tratada por duas diferentes tcnicas de previso. A adio de Redes Neurais ao mtodo de decomposio clssica alcanou resultados superiores. O mtodo aqui empregado (RN e decomposio) alcanou no s a menor mdia entre os trs, como tambm o menor desvio-padro da amostra de erros mensais de previso. Conclui-se que a Rede Neural conseguiu contribuir de forma significativa para este problema de previso, reduzindo o erro de uma srie j tratada nos domnios do tempo e da freqncia em 10%, o que se torna um mrito importante para o mtodo. As Redes Neurais conseguem eficincia destacada quando tratam de no-linearidades. A postura durante todo este artigo foi utilizar este mtodo aliado a outras tcnicas de previso, no caso, a decomposio clssica. Atravs desta combinao, possvel executar melhores previses, pois a rede trata a parte no-linear do problema, enquanto os outros mtodos se encarregam da previso de padres lineares. Assim, a Rede Neural fica colocada como um instrumento que possibilita uma margem de melhoria na previso dos mtodos clssicos. Os resultados encontrados foram importantes para a colocao de trs proposies importantes: A) Redes Neurais no so a melhor soluo sempre Muitas vezes, quando uma nova tcnica de previso ou otimizao aparece com resultados interessantes, esta se torna rapidamente a melhor tcnica existente. Isto no verdade quando se fala de Redes Neurais. Assim como todas as tcnicas, existem casos em que seu uso pode ser perfeitamente dispensvel. Os resultados encontrados evidenciam que as sries trabalhadas j possuam uma tima aproximao pelos mtodos lineares. Assim sendo, o acrscimo da rede no proporciona um ganho to grande na reduo de resduos, j que o padro no-linear restante menor que com a perturbao aleatria da srie.

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

357

Calba et al. Cooperao entre redes neurais artificiais e tcnicas clssicas para previso de demanda de uma srie de vendas de cerveja na Austrlia

B) A no-linearidade um problema que pode ser tratado convenientemente por Redes Neurais Se por um lado a rede neural no pode resolver tudo, nos casos em que mtodos clssicos de previso no conseguem resultados bons devido a no linearidades, a rede pode conseguir performances significativas, no s no campo da previso, como na classificao e otimizao. C) Associar mtodos clssicos lineares e redes neurais parece levar a bons resultados no tratamento de problemas (fracamente) no lineares Como se pde ver durante este trabalho, a combinao de redes neurais e outras tcnicas de previso comps um mtodo de previso melhor que o uso separada das tcnicas. Este o ponto chave deste trabalho: a cooperao entre redes neurais e outros mtodos para uma previso mais acurada. Referncias Bibliogrficas (1) Calba, L.P. (1988). Introduo Computao Neuronal. Anais 9o CBA, UFES ES. (2) Chatfield, C. (1989). The Analysis of Time Series An Introduction. Chapman and Hall, New York. (3) Haykin, S. (1999). Neural networks, a Comprehensive Foundation. 2nd ed. Prentice Hall, Englewood Cliffs, New Jersey. (4) Hecht-Nielsen, R. (1990). Neurocomputing. Addinson-Wesley Publishing Company, New York. (5) Morettin, P.A. & Toloi, C.M. de C. (1987). Previso de Sries Temporais. Atual Editora, So Paulo. (6) Wasserman, P.D. (1989). Neural Computing, Theory and Pratice. Van Nostrand Reinhold, New York. (7) Wonnacott, T. & Wonnacott, R. (1990). Introductory Statistics for Business and Economics. John Wiley & Sons, New York.

358

Pesquisa Operacional, v.22, n.3, p.345-358, julho a dezembro de 2002

Vous aimerez peut-être aussi