Teoria Do Controle Otimo Capitulo 7 Stamford

1 Captulo 7 Controle timo: O princpio do mximo O clculo das variaes, o mtodo clssico para atacar problemas de otimizao dinmica,
assim como o clculo comum, requer para sua aplicabilidade a diferenciabilidade das funes que entram no problema. Mais importante que isso que apenas solues interiores podem ser manipuladas. Um desenvolvimento mais moderno que pode trabalhar com caractersticas no clssicas tais como soluo de canto, encontrado na teoria do controle timo. Como seu nome indica, a formulao de controle timo do problema de otimizao dinmica foca uma ou mais variveis que servem como instrumentos de otimizao. Diferente, entretanto, do clculo das variaes, onde nosso objetivo encontrar o caminho temporal timo para uma varivel estado y, a teoria do controle timo tem como sua principal meta a determinao do caminho timo para a varivel de controle u. Certamente, logo que o caminho do controle timo, u*(t), seja encontrado, ns podemos tambm encontrar o caminho do estado timo, y*(t), que corresponde a ele. De fato, os caminhos u*(t) e y*(t) so usualmente encontrados no mesmo processo. Mas a presena de uma varivel de controle como estgio central muda a orientao bsica do problema de otimizao dinmica. Duas questes so propostas imediatamente. O que que uma varivel de controle faz? E como seu ajuste dentro do problema da otimizao dinmica? Para responder essas questes, vamos considerar uma economia ilustrativa simples. Suponha que exista numa economia um estoque finito de recursos exaurveis S (tal como carvo ou leo), como no modelo de Hotelling, com S(0) = S0. Como esse recurso est sendo extrado (e usado), o estoque de recurso ser reduzido de acordo com a relao
dS (t ) = E (t ) dt
onde E(t) denota a taxa de extrao do recurso no tempo t. A varivel E(t) qualificada como varivel de controle porque possui as duas propriedades seguintes. Primeiro, ela algo que esta sujeito a nossa escolha arbitrria. Segundo, nossa escolha de E(t) age sobre a varivel S(t) que indica o estado do recurso a todo instante do tempo. Conseqentemente, a varivel E(t) como um mecanismo de pilotagem em que ns podemos manobrar de forma a dirigir a varivel de estado S(t) para vrias posies em qualquer tempo t por meio da equao diferencial dS(t)/dt = - E(t). Por uma pilotagem correta de tal varivel de controle, ns poderamos, consequentemente, visar a otimizao de algum critrio de performance expresso pelo funcional objetivo. Para o presente exemplo, ns podemos postular que a sociedade quer maximizar a utilidade total derivada do uso do recurso exaurvel sobre um dado perodo de tempo [0,T]. Se no h restrio no estoque final, o problema de otimizao dinmica toma a seguinte forma:
Maximize sujeito a e
U ( E )e
0
dt
dS = E (t ) dt S (0) = S 0
S (T )
livres
(S 0 , T
dados)
Nessa formulao, apenas a varivel de controle E entra no funcional objetivo. Mas, de uma maneira geral, espera-se que o funcional objetivo dependa tanto da(s) varivel(eis) de estado quanto da(s) varivel(eis) de controle. Similarmente, apenas um caso especial que nesse exemplo o movimento da varivel de estado S dependa apenas da varivel de controle E. Em geral, o curso do movimento da varivel de estado sobre o tempo pode ser afetado tanto por varivel (variveis) de estado quanto por varivel (variveis) de controle, e ainda pela prpria varivel t. Com esse conhecimento, ns agora continuamos a discusso do mtodo de controle timo. 7.1 O PROBLEMA BSICO DE CONTROLE TIMO Para manter uma estrutura introdutria simples, primeiro vamos considerar um problema com uma nica varivel de estado y e uma nica varivel de controle u. Como sugerido anteriormente, a varivel de controle o instrumento de poltica que nos habilita a influenciar a varivel de estado. Assim, qualquer escolha do caminho de controle u(t) ir implicar num caminho de estado associado y(t). Nossa tarefa escolher um caminho timo admissvel u*(t) no qual, ao longo do caminho de estado timo admissvel y*(t), iremos otimizar o funcional objetivo sobre o intervalo de tempo [0,T]. Caractersticas Especiais dos Problemas de Controle timo
3 u c b a t t1 t2
(b) A
y
C Trajetria estado
Trajetria de controle
t1
(a) Figura 7.1
t2
Uma caracterstica notvel da teoria do controle timo a de que um caminho de controle no precisa ser contnuo para se transformar em admissvel; ele apenas precisa ser contnuo por partes. Isso significa que ele pode conter saltos descontnuos, como ilustrado na figura 7.1a, apesar de no podermos permitir descontinuidades que envolvam um valor infinito de u. Uma boa ilustrao de controle contnuo por partes na vida diria o liga e desliga da chave do computador ou da ignio. Quando giramos a chave para ligar (u = 1) e desligar (u = 0), a trajetria do controle experimenta um salto. A trajetria de estado y(t), por outro lado, deve ser contnua no perodo de tempo [0,T]. Mas, como ilustrado na Fig. 7.1b, permite-se que tenha um nmero finito de pontos agudos, ou quinas. Isto , para ser admissvel, uma trajetria de estado necessita apenas ser diferencivel por partes1. Note que cada ponto agudo sobre a trajetria do estado aparece no tempo em que o caminho do controle d um salto. A razo para esse ritmo coincidente est no processo de obteno da soluo do problema. Uma vez que tenhamos encontrado que o segmento do controle timo para o intervalo de tempo [0,t1) , digamos, a curva ab na Fig 7.1a, ns tentamos ento determinar o segmento correspondente da trajetria tima de estado. Ela pode ser, digamos, a curva AB, na Fig. 7.1b, cujos pontos iniciais satisfazem uma dada condio inicial. Para o prximo intervalo, [t1,t2), determinamos novamente o segmento da trajetria de estado timo sobre a base do controle timo pr encontrado, curva cd, mas dessa vez devemos tomar o ponto B como ponto inicial do segmento de estado timo. Da, o ponto B serve como ponto terminal para o primeiro segmento e como ponto inicial para o segundo segmento da trajetria de estado timo. Por essa razo, no h descontinuidade no ponto B, apesar de aparecer como um ponto agudo. Como trajetria de controle admissvel, a trajetria admissvel deve ter um valor finito y para todo t no intervalo de tempo [0,T]. Outra caracterstica importante que a teoria de controle timo capaz de manipular diretamente uma restrio na varivel de controle u, tal como a limitao u (t ) U para
1
Pontos agudos numa trajetria de estado podem tambm ser acomodados no clculo de vrias variveis via as condies de Weierstrass-Edrmann. Ns no discutimos esse assunto nesse livro, por causa da relativa raridade de suas aplicaes econmicas. O leitor interessado pode consultar qualquer livro sobre clculo das variaes.
4 todo t [0, T ], onde U denota algum conjunto de controle limitado. O conjunto controle pode ser de fato fechado, conjunto convexo, tal como u (t ) [0,1] . O fato de que U possa ser um conjunto fechado significa que solues de canto (solues de fronteiras) podem ser admitidas, o que insere uma importante caracterstica no clssica na estrutura do problema. Quando essa caracterstica combinada com a possibilidade de saltos descontnuos na trajetria de controle, um fenmeno interessante chamado de soluo bang-bang pode ocorrer. Assumindo que o conjunto controle seja U = [0,1], por exemplo, a trajetria do controle timo ir saltar como segue: u*(t) = 1 para t [o, t1 ) u*(t) = 0 para t [t1 , t 2 ) u*(t) = 1 para t [t 2 , T ]
t1 < t 2 t2 < T
ento estaremos ricocheteando* (banging) sucessivamente entre um e outro limite do conjunto de controle U; da, o nome bang-bang. Finalmente, chamamos a ateno de que o problema bsico da teoria do controle timo, diferente do clculo das variaes, tem um estado terminal livre (linha terminal vertical) ao invs de um ponto terminal fixo. A primeira razo para isso que: No desenvolvimento das condies fundamentais de primeira ordem conhecido como princpio mximo, invocamos a noo de um u arbitrrio. Qualquer u arbitrrio deve, portanto, implicar num y associado. Se o problema tem um estado terminal fixo, precisamos prestar ateno se o y associado ir para o estado terminal designado. Assim, a escolha de u pode no ser inteiramente e verdadeiramente arbitrria. Se o problema tem um estado terminal livre (linha terminal vertical), por outro lado, ento podemos arbitrar um u sem qualquer preocupao com o destino final de y. E isto simplifica o problema. O problema bsico Baseado na discusso precedente, podemos colocar o problema bsico do controle timo como
T
Maximize
(7.1)
V = F (t , y, u )dt
0
sujeito a e
y = f (t , y, u ) y (0) = A y (T ) livre ( A, T u (t ) U para todo t [0, T ]
dados )
Aqui, como na discusso subseqente, nos ocuparemos exclusivamente com o problema de maximizao. Nesse aspecto, as condies necessrias para otimizao podem ser
*
N.T. O termo em ingls foi mantido entre parnteses por no ter traduo direta para o portugus
5 estabelecidas com mais especificidade e menos confuso. Quando for encontrado um problema de minimizao, podemos sempre reformul-lo como um problema de maximizao simplesmente colocando o sinal de menos no funcional objetivo. Por exemplo, minimizar
F (t , y, u )dt equivalente a maximizar
F (t , y, u )dt .
Em (7.1), o funcional objetivo ainda toma a forma de uma integral definida, mas a funo integrando F no inclui o argumento y como no clculo das variaes. Ao contrrio, existe um novo argumento u. A presena da varivel de controle u necessita de uma ligao entre u e y, para nos dizer como u afeta especificamente o curso tomado pela varivel de estado y. Essa informao fornecida pela equao y = f (t , y, u ) , onde o smbolo com ponto y , denotando a derivada dy/dt, uma notao alternativa para o smbolo y usado antes2. No tempo inicial, os dois primeiros argumentos na funo f devem tomar valores dados t = 0 e y(0) = A, ento apenas o terceiro argumento est sob nossa escolha. Para alguma poltica escolhida em t = 0, digamos, u1 (0) , essa equao produzir um valor especfico para y , digamos, y1 (0) , que impe uma direo especfica para a qual a varivel y move-se. Uma poltica diferente u 2 (0) , geralmente nos dar um valor diferente, y 2 (0) , via a funo f. E um argumento similar aplicar-se- a outros pontos do tempo. O que essa equao faz, todavia, fornecer um mecanismo pelo qual nossa escolha do controle u poder ser transformada num padro especfico de movimento da varivel de estado y. Por essa razo, essa equao conhecida como a equao de movimento para a varivel de estado (ou, para simplificar, a equao de estado). Normalmente, a ligao entre u e y pode ser adequadamente descrita pela equao diferencial de primeira ordem y = f (t , y, u ) . Entretanto, se existir um padro de mudana da varivel de estado y que no possa ser capturado pela primeira derivada y mas que requer o uso da segunda derivada d 2 y / dt 2 , ento a equao de estado tomar a forma y de uma equao diferencial de segunda ordem, que ns deveremos transformar num par de equaes diferenciais de primeira ordem. A complicao que, no processo de transformao, uma varivel de estado adicional dever ser introduzida no problema. Um exemplo de tal situao pode ser encontrado na seo 8.4. Ns usaremos consistentemente a letra f minscula como smbolo da funo na equao de movimento, e reservaremos a letra maiscula F para a funo integrando no funcional objetivo. Assume-se que as funes F e f so contnuas em todos os seus argumentos, e possuem derivadas parciais de primeira ordem contnuas com respeito a t e y, mas no necessariamente com respeito a u. O resto do problema (7.1) consiste de especificaes com relao aos conjuntos de fronteira e de controle. Da mesma forma que o caso da linha-terminal-vertical bsico e foi implementado, outras especificaes de ponto-terminal tambm podem ser acomodadas. Igualmente para o conjunto controle, o caso bsico de U ser um conjunto aberto U = (,+) . Se entretanto, a escolha de U de fato no restritiva, em tal caso poderemos, de um modo geral, omitir a imposio u (t ) U do problema.
2
Ainda que y e y sejam smbolos alternativos, usaremos y exclusivamente no contexto da teoria do controle timo, para fazer distino do contexto do clculo das variaes.
Um caso especial Como um caso especial, considere o problema onde a escolha de u no restringida, e onde a equao de movimento toma uma forma particularmente simples
y=u
Ento o problema de controle timo fica
T
Maximize
(7.2)
V = F (t , y, u )dt
0
sujeito a
y=u y (0) = A
y (T )
livres
( A, T
dados )
Substituindo a equao de movimento na funo integrando, entretanto, podemos eliminar y e reescrever o problema como
(7.2)
Maximize sujeito a
V = F (t , y, y )dt
0
y (0) = A
y (T )
livres
( A, T
dados )
Este precisamente o problema de clculo das variaes com linha terminal vertical. A ligao fundamental entre o clculo das variaes e a teoria do controle timo , ento, evidente. Mas, as equaes de movimento encontradas nos problemas de controle timo so geralmente mais complicadas que em (7.2). 7.2 O PRINCPIO DO MXIMO O resultado mais importante na teoria do controle timo uma condio necessria de primeira ordem conhecida como o princpio do mximo. Esse termo foi cunhado pelo matemtico russo L S Pontryagin e seus associados3. Como mencionado na seo 1.4, entretanto, a mesma tcnica foi independentemente descoberta por Maguns Hestenes, um matemtico da Universidade da Califrnia, Los Angeles, que depois tambm expandiu os resultados de Pontryagin. O enunciado do princpio do mximo envolve o conceito da funo Hamiltoniana e da varivel co-estado. Devemos, entretanto, primeiro explicar esses conceitos. A varivel de co-estado e a funo Hamiltoniana
L. S. Pontryagin, V. G. Boltyanski, R. V. Gamkrelidze, e E. F. Miahchenko, O proceso Matemtico do Controle timo (The Mathematical Theory of Optimal Processes), traduzido do russo por K.N. Trirogoff, Interscience, New York, 1962. Esse livro ganhou em 1962 o Prmio Lnin de Cincia e Tecnologia.
Trs tipos de variveis foram apresentadas no problema (7.1): t (tempo), y (estado) e u (controle). No processo de soluo, outro tipo de varivel emerge. Ela chamada de varivel de co-estado (ou varivel auxiliar) e ser designada por . Como veremos, a varivel de co-estado similar ao multiplicador de Lagrange e, como tal, tem carter de uma varivel de valorao, medindo o preo sombra de uma varivel de estado associada. Como y e u, a varivel pode tomar diferentes valores em diferentes pontos do tempo. Assim, o smbolo na verdade uma notao simplificada para (t). O veculo pelo qual a varivel de co-estado entra no problema do controle timo a funo Hamiltoniana, ou simplesmente, o Hamiltoniano, que figura com muito destaque no processo de soluo. Denotando por H, o Hamiltoniano definido como (7.3)
H (t , y, u, ) F (t , y, u ) + (t ) f (t , y, u )
Desde que H consiste da funo integrando F mais o produto da varivel de co-estado pela funo f, ele naturalmente uma funo com quatro argumentos: t, y, u bem como . Note que, em (7.3), ns designamos um coeficiente unitrio para F, o que entra em contraste com o coeficiente ainda indeterminado (t) de f. Rigorosamente falando, o Hamiltoniano deveria ser escrito como (7.4)
H (t , y, u, ) 0 F (t , y, u) + (t ) f (t , y, u)
onde 0 uma constante no negativa, tambm ainda indeterminada. Para o problema (7.1) da linha-terminal-vertical, a constante 0 torna-se sempre no nula (estritamente positiva); assim, ela pode normalizada para o valor unitrio, reduzindo (7.4) a (7.3). O fato de ser 0 0 no problema bsico devido a duas condies do princpio do mximo. Primeiro, os multiplicadores 0 e (t) no podem desaparecer simultaneamente em nenhum ponto do tempo. Segundo, a soluo do problema da linha-terminal-vertical deve satisfazer a condio de transversalidade (T) = 0, que ser explicada na discusso que se segue. A condio (T) = 0 requer um valor no nulo para 0 em t = T. Mas, desde que 0 uma constante no negativa conclumos que 0 uma constante positiva, que pode ser normalizada para a unidade. Para formulaes do problema do controle timo diferente de (7.1), por outro lado, 0 pode tornar-se zero, invalidando desta forma o Hamiltoniano em (7.3). O purista, entretanto, insistir em checar que 0 de fato positivo em todo problema, antes de usar o Hamiltoniano (7.3). O processo de checagem envolver uma demonstrao onde a hiptese de que 0 = 0 conduzir a uma contradio e violar a condio mencionada antes, de que, 0 e (t) no podem desaparecer simultaneamente4. Na realidade, porm, a eventualidade de um 0 nulo acontece apenas em certas situaes no usuais (algumas digamos patolgicas) onde a soluo do problema independente da funo integrando, F, ou
4
Para exemplos especficos do processo de checagem veja, Akira Takayama, Mathematical Economics 2ed., Cambridge Universty Press, Cambridge, 1985, pp. 617 618, 674 675, e 679 680.
8 seja, onde a funo F no tem importncia no processo da soluo5. exatamente esse o motivo pelo qual se pode pr o coeficiente 0 igual a zero, para fazer a funo F sair do Hamiltoniano. Como muitos dos problemas encontrados em economia so do tipo onde a funo F tem importncia, a prtica prevalecente entre os economistas simplesmente assumir 0 > 0 , normalizando-o ento para a unidade e usando o Hamiltoniano (7.3), sempre que o problema no for daquele com uma linha terminal vertical. Essa a prtica que seguiremos. O princpio do mximo Em contraste com a equao de Euler que uma simples equao diferencial de segunda ordem na varivel de estado y, o princpio do mximo envolve duas equaes diferenciais de primeira ordem na varivel de estado y e na varivel de co-estado . Junto com essas equaes, exigido tambm que o Hamiltoniano seja maximizado com respeito as variveis de controle u em todo ponto do tempo. Para uma eficincia pedaggica, primeiro explicamos e discutimos as condies envolvidas, antes de fornecer a racionalidade do princpio do mximo. Para o problema em (7.1), e com o Hamiltoniano definido em (7.3), as condies para o princpio do mximo so
Max
u
H (t , y, u, )
para todo t [0, T ]
(7.5)
H H = y (T ) = 0 y=
O smbolo
[equao de movimento para y ] [equao de movimento para ] [condio de transversalidade]

significa que o Hamiltoniano deve ser maximizado
Max H
u
exclusivamente com respeito a u como varivel de escolha. Um modo equivalente de expressar essa condio (7.6)
H (t , y, u * , ) H (t , y, u, ) para todo t [0, T ]
onde u* o controle timo, e u qualquer outro valor de controle. Na discusso a seguir, para simplificar, vamos usar algumas vezes uma notao mais curta Max H para indicar essa exigncia sem mencionar explicitamente u. O leitor notar que esse requerimento de maximizar H com respeito a u que faz surgir o nome o princpio do mximo. Pode parecer a princpio que o requerimento em (7.6) possa ser resumidamente colocado na condio de primeira ordem H / u = 0 (particularmente suportado por uma condio de segunda ordem apropriada). A verdade, entretanto, que a exigncia de
5
Um exemplo de um problema como esse pode ser encontrado em Morton I. Kamien e Nancy L. Schwartz, Dynamic Optimazation: The Calculus of Variations and Control Optimal in Economics and Management, 2ed., Elsevier, New York, 1991, p. 149.
Max H uma exigncia muito mais extensa desse requerimento. Na fig. 7.2, desenhamos
u
trs curvas, cada uma indicando um possvel grfico do Hamiltoniano H contra a varivel de controle u em um ponto especfico do tempo, para valores especficos de y e . Assumese que a regio de controle o intervalo fechado [a,c]. Para a curva 1, que diferencivel com respeito a u, o mximo de H ocorre em u = b, um ponto interior da regio de controle U; nesse caso, a equao H / u = 0 pode de fato servir para identificar o controle timo em cada ponto do tempo. Mas, se a curva 2 a curva relevante, ento o controle que maximiza H em U, u = c, um ponto limite de U. Assim a condio H / u = 0 no se aplica ainda que a curva seja diferencivel. E no caso da curva 3, com o Hamiltoniano
Curva 1
Curva 2
Curva 3
u a 0 U
Figura 1 7.2
linear em u, o mximo de H ocorre em u = a, outro ponto limite e a condio H / u = 0 novamente inaplicvel porque a derivada no igual a zero em nenhum lugar. Em resumo, enquanto a condio H / u = 0 pode servir ao propsito quando o Hamiltoniano diferencivel com respeito a u e produz uma soluo interior, o fato de que a regio de controle possa ser um conjunto fechado, com possibilidade de solues de canto, necessita da exigncia mais ampla de Max H . De fato, sob o princpio do mximo no se requer
u
sempre que o Hamiltoniano seja diferencivel com respeito a u. O caso onde o Hamiltoniano linear em u de especial interesse. Ele tanto uma situao especialmente simples de manipular quando se traa o grfico de H contra u como tambm uma linha reta positiva ou negativamente inclinada, pois o controle timo sempre encontrado num dos limites de u. A tarefa apenas determinar qual dos limites. (Se o grfico de H contra u uma linha horizontal, ento no existe controle timo nico). Mais importante ainda, esse caso serve para realar como uma situao incmoda no clculo das variaes torna-se facilmente manipulvel na teoria do controle timo. No clculo das variaes, sempre que a funo integrando linear em y , resultando Fyy = 0 , a equao de Euler no produz uma soluo que satisfaa as condies de limite dado. Na teoria do controle timo, ao contrrio, esse caso no apresenta qualquer problema.
10
Partindo-se para as outras partes de (7.5), notamos que a condio y = H / no nada mais que uma reafirmao da equao de movimento da varivel de estado originalmente especificada em (7.1). O nico motivo de re-expressar y como a derivada parcial de H com respeito a varivel de co-estado mostrar a simetria entre essa equao de movimento e a varivel de co-estado. Note, entretanto, que na ltima equao de movimento, o negativo da derivada parcial de H com respeito a varivel de estado y. Juntas, as duas equaes de movimento so referidas coletivamente como o sistema Hamiltoniano, ou sistema cannico (significando o sistema de equaes diferenciais padro) para o dado problema. Contudo ns temos mais que uma equao diferencial para tratar na teoria do controle timo uma para cada varivel de estado e uma para cada varivel de co-estado cada equao diferencial apenas de primeira ordem. Desde que a varivel de controle nunca aparece na forma derivada, no existe equao diferencial para u no sistema Hamiltoniano. Mas, da soluo bsica de (7.5) pode-se, se desejado, obter uma equao diferencial para a varivel de controle. E, em alguns modelos, pode ser mais conveniente tratar com um sistema dinmico nas variveis (y, u) no lugar do sistema cannico nas variveis (y, ). A ltima condio em (7.5) a condio de transversalidade para o problema de estado-terminal-livre aquele com uma linha terminal vertical. Como ns esperaramos, tal condio diz respeito apenas ao que deveria ocorrer no tempo terminal T.
EXEMPLO 1: Ache a curva de menor distncia de um ponto P dado para uma linha reta L dada. Ns j tnhamos encontrado esse problema no clculo das variaes. Para reformullo como um problema de controle timo, seja o ponto P(0,A), e assuma, sem perda de generalidade, que a linha L uma linha vertical. (Se a posio da linha no for vertical, pode-se sempre fazer que seja atravs de uma rotao apropriada nos eixos). A funo F
previamente usada 1 + y2 pode ser reescrita como 1 +u 2 , onde y = u ou y = u . Para converter o problema de minimizao-de-distncia para maximizao, devemos tambm, colocar o sinal de menos no integrando. Ento, nosso problema
T 1/ 2
1/ 2
1/ 2
Maximize
(7.7)
V = 1+ u2
0
dt livre ( A, T dados )
sujeito a
y=u y (0) = A
y (T )
Note que a varivel de controle no restringida, portanto o controle timo ser uma soluo interior. Etapa i (7.8) Comeamos escrevendo a funo Hamiltoniana
H = 1+ u2
1/ 2
+ u
observando que H diferencivel e no linear, podemos aplicar a condio de primeira ordem H / u = 0 para obter
11
H 1 = 1+ u2 u 2
1/ 2
(2u ) + = 0
Isso produz a soluo6 (7.9)
u (t ) = 1 2
1/ 2
Alm disso a diferenciao de H / u usando a regra do produto produz
2H = 1+ u2 2 u
3 / 2
<0
Assim, o resultado em (7.9) maximiza H. Mesmo que (7.9) expresse u em termos de , ns vemos agora encontrar uma soluo para . Etapa ii Para fazer isso, ns recorremos a equao de movimento da varivel de co-estado H em (7.5). Mas, como (7.8) mostra que H independente de y, temos = y (7.10)
H =0 y
(t ) = constante
Convenientemente, a condio de transversalidade (T ) = 0 em (7.5) suficiente para definir a constante. Pois, se uma constante, ento seu valor em t = T tambm seu valor para todo t. Assim, (7.10)
* (t ) = 0 para todo t [0, T ]
Observando (7.9), ns tambm poderemos concluir que (7.11)
u * (t ) = 0 para todo t [0, T ]
Etapa iii Da equao de movimento y = u , estamos agora capacitados a escrever

6
A equao
H / u = 0 pode ser escrita como
= 2 Elevando ao quadrado em ambos os lados, multiplicando por 1 + u e arrumando os termos, obteremos u 2 1 2 = 2 2 Esse resultado implica que 1 , de outra forma a equao produziria 0 = 1, o que impossvel. Dividindo 2 ambos os lados pela quantidade no nula 1 e tomando a raiz quadrada ns finalmente chegaremos a
u 1 u2
1 / 2
(7.9)
12
(7.12)
y=0
y(t ) = constante
Mais ainda, a condio inicial y(0) = A habilita-nos a definir essa constante e escrever (7.12)
y * (t ) = A
y* (t ) = A
B Figura 7.3
t
0 T
Esse caminho y*, ilustrado na Fig. 7.3, uma linha reta horizontal. Alternativamente, ele pode ser visto como um caminho ortogonal para a linha terminal vertical. EXEMPLO 2 Encontre o controle timo que
T
Maximize
(7.13)
V = (2 y 3u )dt
0
sujeito a e
y = y+u y (0) = 4 y (2) u (t ) U = [0,2]
livre
Como esse problema caracterizado pela linearidade em u e um por um conjunto de controle fechado, podemos esperar que ocorram solues de canto. Etapa i O Hamiltoniano de (7.13), nominalmente,
H = 2 y 3u + ( y + u ) = (2 + ) y + ( 3)u
linear em u, com inclinao H / u = 3 . Se em um dado ponto do tempo, encontramos > 3, ento uma curva de inclinao ascendente como a curva 1 na Fig. 7.4 ir prevalecer; para maximizar H, devemos escolher u* = 2. Se por outro lado < 3, ento a curva 2 ir prevalecer, e deveremos escolher u* = 0. Em resumo,
13
2 u * (t ) = 0
> se (t ) 3 <
As solues u* = 2 e u* = 0 so, certamente, solues de canto. Note que, pelo fato de H ser linear em u, a condio de primeira ordem usual H / u = 0 inaplicvel na nossa busca por u*. Etapa ii Nossa prxima tarefa determinar (t), dado que ele necessrio em (7.14). Da equao de movimento de , ns teremos a equao diferencial
H = 2 ou + = 2 y
H
Max H Curva 1 >3
Max H
Curva 2 <3
Figura 7.4
u
0 2
Sua soluo geral 7
(t ) = ke t 2 (k arbitrria)
Desde que a constante arbitrria k pode ser definida como k = 2e 2 pela utilizao da condio de transversalidade (t) = (2) = 0, poderemos escrever a soluo definitiva como (7.15)
* (t ) = 2e2et 2 = 2e2t 2
Note que * (t ) uma funo decrescente, caindo do valor do estado inicial * (0) = 2e 2 2 12,778 para o valor final * (2) = 2 2 = 0 . Assim, * primeiramente excede 3 e eventualmente cai abaixo de 3. O ponto crtico no tempo, quando * = 3 e quando o controle timo muda abruptamente de u* = 2 para u* = 0, pode ser encontrado colocando * (t) = 3 em (7.15) e resolvendo para t. Denotando esse t particular pela letra grega , teremos
7
Equaes lineares de primeira ordem desse tipo so explicadas na Sec. 14.1, de Alpha C. Chiang, Fundamental Methods of Matematical Economics, 3 ed. McGraw-Hill, New York, 1984.
14 (7.16)
= 2 ln 2,5 1,084
Conseqentemente, o controle timo em (7.14) pode ser reescrito mais especificamente em duas fases: (7.17) Fase I: u *I u *[0, ) = 2 Fase II: u *II u * [ ,2] = 0
u* (a) 2
Fase I
Fase II
1 = 1,083
39,339 (b) 15,739 4,000

y*II y*I
Figura 7.5
1 = 1,083
Como descrito graficamente na Fig. 7.5a, esse controle timo exemplifica uma variante simples de bang-bang. Etapa iii Ainda que o problema pergunte somente o caminho do controle timo, ns podemos encontrar tambm o caminho de estado timo, em duas fases. Na fase I, a equao de movimento para y y = y + u = y + 2 , ou
y y = 2 com valor inicial y(0) = 4

Sua soluo (7.18)
y *I y * [0, ) = 2 3e t 1
Na fase II, a equao de movimento para y y = y + 0 , ou
15
yy=0
com soluo geral (7.19)
y *II y *[ ,2] = ce t (c arbitrria)
Note que a constante c no pode ser definida pelas condies iniciais y(0) = 4 dada em (7.13) porque j estamos na fase II, depois de t = 0. Nem pode ser definida por qualquer condio terminal porque o estado terminal livre. Entretanto, o leitor lembrar do requerimento de que o caminho timo y deva ser contnuo, como ilustra a Fig. 7.1b. Conseqentemente, o valor inicial de y*II deve ser igual ao valor de y*I em . Porquanto,
y *I = 2 3e 1
[por (7.18)] [por (7.19)]
y *II = 2e
encontramos, igualando essas duas expresses e resolvendo para c, que c = 2(3 e ) , portanto o caminho timo y na fase II (7.19)
y*II = 2 3 e 5,324et
O valor de y* no tempo de troca aproximadamente 2(3e1, 096 1) = 15,739 . Combinando os dois caminhos (7.18) e (7.19), obteremos o caminho completo y* para o intervalo de tempo [0,2], como exposto na Fig. 7.5b. Nesse particular exemplo, a juno dos caminhos parece uma curva exponencial simples, mas os dois segmentos so de fato partes de duas curvas exponenciais separadas. Exerccios 7.2 1 2 No exemplo 2, (t) uma funo decrescente, e atinge o valor 3 apenas em um ponto do tempo, . O que acontece se (t) = 3 para todo t? Encontre os caminhos timos das variveis de controle, estado e co-estado para
3 ydt
0
y = y+u y (0) = 5 y (4) u (t ) U = [0,2]
livre
Cheque que de fato o Hamiltoniano maximizado ao invs de minimizado. 3 Encontre os caminhos timos das variveis de controle, estado e co-estado para
16
Maximize sujeito a
(y u )dt
2 0
y=u y (0) = 0
y (2)
livre
u (t ) no restrito
Verifique que o Hamiltoniano maximizado ao invs de minimizado. 4 Encontre os caminhos timos das variveis de controle, estado e co-estado para
Maximize sujeito a
2 (y
0
+ u 2 dt y (1) livre u (t ) no restrito
y=uy y ( 0) = 1
Verifique que o Hamiltoniano maximizado ao invs de minimizado. [Sugesto: Duas equaes de movimento devem ser resolvidas simultaneamente. Revise o material sobre equaes diferenciais simultneas em Alpha C. Chiang, Fundamental Methods of Mathematical Economics, 3ed., McGraw-Hill, New York, 1984, Sc. 18.2] 7.3 A RACIONALIDADE DO PRINCPIO DO MXIMO
Vamos agora explicar a racionalidade subjacente ao princpio do mximo. O que ns planejamos fazer no dar uma prova detalhada mas, apresentar uma variao do problema para tornar o princpio do mximo plausvel a prova completa dada por Pontryagin e seus associados (Cap. 2 do seu livro) tem algo em torno de 40 pginas. Isso ser reforado mais tarde fazendo-se uma comparao das condies do princpio do mximo com a equao de Euler e as outras condies do clculo das variaes. Uma viso variacional do problema do controle Para tornar as coisas simples, assume-se aqui que a varivel de controle u irrestrita, de forma que u* uma soluo interior. Alm disso, assumido que a funo Hamiltoniana diferencivel com respeito a u e que a condio H / y = 0 pode ser invocada no lugar da condio Max H. Como usual, tomamos o ponto inicial como um ponto fixo, mas permitido ao ponto terminal variar. Isso ir nos habilitar a derivar certas condies de transversalidade no processo da discusso. O problema ento fica
Maximize sujeito a
V = F (t , y, u )dt
0
y = f (t , y, u ) y (0) = y 0 dado
17 Etapa i Como primeiro passo no desenvolvimento do princpio do mximo, incorporaremos a equao de movimento dentro do funcional objetivo e ento reexpressaremos o funcional em termos do Hamiltoniano. O leitor observar que, se a varivel y sempre obedece a equao de movimento, ento a quantidade [ f (t , y, u ) y ] ir seguramente tomar um valor zero para todo t no intervalo [0,T]. Assim, usando a noo dos multiplicadores de Lagrange, podemos formar uma expresso (t )[ f (t , y, u ) y] para cada valor de t, e ainda ter um valor zero. Apesar de existir um nmero infinito de valores de t no intervalo [0,T], somando (t )[ f (t , y, u ) y] sobre o tempo no perodo [0,T] ainda iremos produzir um valor geral zero: (7.21)
(t )[ f (t , y, u ) y ]dt = 0
Por essa razo, podemos aumentar o antigo funcional objetivo com a integral em (7.21) sem afetar a soluo. Isso , podemos trabalhar com um novo funcional objetivo
(7.22)
= V + (t )[ f (t , y, u ) y ]dt
0
= {F (t , y, u ) + (t )[ f (t , y, u ) y ]}dt
0
confiando que ter os mesmos valores que V, pois a equao de movimento em (7.20) obedecida em todos os pontos do tempo. Previamente, tnhamos definido a funo Hamitoniana como
H (t , y, u, ) F (t , y, u ) + (t ) f (t , y, u )
A substituio da funo H dentro de (7.22) pode simplificar o novo funcional para a forma
(7.22)
= [ H (t , y, u ) (t ) y ]dt
0
= H (t , y, u, )dt (t ) ydt
0 0
importante distinguir claramente entre o segundo termo no Hamiltoniano, (t ) f (t , y, u ) , por um lado, e a expresso do multiplicador de Lagrange, (t )[ f (t , y, u ) y] por outro. O ltimo contm explicitamente y , enquanto o anterior no. Quanto a ltima integral em 8 (7.22), integrada por partes , encontramos que
8
A frmula da integrao por partes uma integral definida foi dada em (2.15). Aqui, trocamos o smbolo u em (2.15) por w, porque u agora usado para denotar a varivel de controle. Seja
v = (t ) (implicando que dv = dt ) w = y (t ) (implicando que dw = ydt )
18
T T (t ) ydt = (T ) yT + (0) y 0 + y (t )dt 0 0
Consequentemente, pela substituio desse resultado, o novo funcional objetivo pode ser re-escrito como (7.22)
= [ H (t , y, u, ) + y(t ) ]dt (T ) yT + (0) y0 0

1
2 3
A expresso composta da soma de trs termos, 1, 2 e 3. Note que enquanto o termo 1, uma integral, cobre todo perodo de planejamento [0,T], o termo 2 diz respeito exclusivamente ao tempo terminal T, e 3 diz respeito apenas ao tempo inicial. Etapa ii O valor de depende da escolha dos caminhos no tempo para as trs variveis, y, u e , bem como dos valores escolhidos de T e yT. Na presente etapa, iremos focar . A varivel , sendo um multiplicador de Lagrange, difere fundamentalmente de u e y, pois a escolha do caminho de (t) no ir produzir efeito sobre o valor de , pois a equao de movimento y = f (t , y, u ) estritamente satisfeita no perodo, isto , durante o perodo (7.23)
y=
H y
para todo t [0, T ]
Portanto, para ajudar-nos nas inquietaes do efeito de (t) sobre , simplesmente impomos (7.23) como uma condio necessria para a maximizao de . Isso responsvel por uma das trs condies do princpio do mximo. Essa, claro, uma etapa pouco estremecedora, pois a equao de movimento na realidade dada como uma parte do prprio problema. Etapa iii Agora podemos voltar para o caminho de u(t) e seus efeitos sobre o caminho y(t). Se conhecemos um caminho u*(t) e o perturbamos com uma curva de perturbao p(t), podemos produzir caminhos de controle vizinhos (7.24)
u (t ) = u * (t )+ p(t )
para cada valor de . Mas, de acordo com a equao de movimento y = f (t , y, u ) , existir para cada uma perturbao correspondente no caminho y*(t). Os caminhos na vizinhana de y podem ser escritos como
Ento, desde que
T 0
(t ) ydt = vdw , ns temos

0
T (t ) ydt = [ (t ) y (t )]T + y (t )dt 0
que coincide com o resultado no texto.
19
(7.25)
y (t ) = y * (t )+ q(t )
Alm disso, se T e yT so variveis, tambm teremos (7.26) T = T * + T e yT = y *T + yT (implicando
dT dy = T e T = yT ) d d
Observando as expresses de u e y em (7.24) e (7.25), podemos expressar em termos de , portanto poderemos aplicar a condio de primeira ordem / = 0 . A nova verso de (7.27) =
T ()
{H [t , y * + q(t ), u * + p(t ), ] + [ y * + q(t )]}dt (T ) yT + (0) y0
Etapa iv Agora aplicamos a condio / = 0 . No processo da diferenciao, o termo integral gera, pela frmula (2.11), a derivada (7.28)
T ()
H H dT q(t ) + p(t ) + q(t )dt + [ H + y]t T u d y
E a derivada do segundo termo em (7.27) com respeito a , pela regra do produto, (7.29)
(T )
[por (7.26)] Por outro lado, o termo (0) y0 na equao (7.27) desaparece na diferenciao. Assim, / a soma de (7.28) e (7.29). Adicionando essas duas expresses, entretanto, notamos que um componente de (7.28) pode ser re-escrito como segue:
dyT d (T ) dT yT = (T )yT yT (T )T d dT d
[y]
t =T
dT = (T ) yT T d
[por (7.26)]
Assim, quando a soma de (7.28) e (7.29) igualada a zero, a condio de primeira ordem emerge (aps re-ordenamento) como (7.30)
T H d H = y + q(t ) + u p(t )dt + [ H ]t =T T (T )yT = 0 d 0
Os trs componentes dessa derivada relacionam-se com termos arbitrrios diferentes: O componente da integral contm as curvas de perturbaes arbitrrias p(t) e q(t), enquanto os outros dois envolvem os termos arbitrrios T e yT , respectivamente. Conseqentemente, cada uma das trs devem ser individualmente igualadas a zero para
20 satisfazer (7.30). Colocando o componente integral igual a zero, podemos deduzir duas condies:
H y
H =0 u
A primeira nos d a equao de movimento para a varivel de co-estado (ou simplesmente, a equao de co-estado). E a segunda representa uma verso frgil da condio Max H frgil no sentido de que previamente assumido que H seja
u
diferencivel com respeito a u e que exista uma soluo interior. Desde que o problema bsico tem um T fixo e um yT livre, o termo T em (7.30) automaticamente igual a zero, mas o termo yT no. A fim de que faamos a expresso (T )yT desaparecer, devemos impor a restrio
(T ) = 0
Isso explica a condio de transversalidade em (7.5) Note que apesar do caminho de (t) ter sido anteriormente, na etapa ii, descartado por no ter efeito no valor do funcional objetivo, ele agora, impressionantemente, volta condio anterior. Ns vemos que, para o princpio do mximo trabalhar, o caminho (t) no deve ser arbitrariamente escolhido, mas imposto que ele siga uma equao de movimento prescrita e que finalize com um valor terminal de zero se o problema tem um estado terminal livre. 7.4 CONDIES TERMINAIS ALTERNATIVAS O que acontecer ao princpio do mximo quando a condio terminal especificar alguma outra coisa ao invs de linha terminal vertical? A resposta geral que as trs primeiras condies em (7.5) ainda sero asseguradas, mas a condio de transversalidade assumir uma forma alternativa. Ponto Terminal Fixo A razo pela qual o problema com um ponto terminal fixo (com ambos, o estado terminal e o tempo terminal fixos) no se qualifica como um problema bsico na teoria do controle timo que a especificao de um ponto terminal fixo acarreta uma complicao na noo de uma curva de perturbao arbitrria p(t) para a varivel de controle u. Se a perturbao do caminho u*(t) suposta para gerar atravs da equao de movimento y = f (t , y, u ) uma perturbao correspondente no caminho y*(t) que tem que acabar em um estado terminal pr-estabelecido, ento a escolha da curva de perturbao p(t) no verdadeiramente arbitrria. A questo ento procede como se ainda pudssemos deduzir legitimamente a condio H / u = 0 de (7.30). Afortunadamente, a validade do princpio do mximo no afetada por esse compromisso na arbitragem de p(t). Por simplicidade, todavia, no entraremos em detalhes
21 para demonstrar esse ponto. Para nossos propsitos, suficiente afirmar que, com um ponto terminal fixo, a transversalidade substituda pela condio
y(T ) = yT
( T, yT dados)
Linha Terminal Horizontal (O Problema do Pontofinal-Fixo) Se o problema tem uma linha terminal horizontal (com um tempo terminal livre mas um ponto final fixo, significando um estado terminal fixo), ento yT fixo (yT = 0), mas T no ( T arbitrrio). Do segundo e terceiro termos componentes em (7.30), fcil ver que a condio de transversalidade para esse caso (7.31)
[H ]t =T = 0
A funo Hamiltoniana deve atingir um valor zero no tempo terminal timo. Mas, no existe restrio sobre o valor de no tempo T. Curva terminal Caso uma curva terminal yT = (T ) governe a seleo do ponto terminal, ento T e yT no sero ambos arbitrrios, mas ligados um ao outro pela relao yT = (T )t . Usando isso para eliminar yT , podemos combinar os dois ltimos termos em (7.30) numa simples expresso envolvendo apenas T :
[H ]t =T T (t ) (T )T = [H ]t =T T
Segue-se que, para um T arbitrrio, a condio de transversalidade deva ser (7.32)
[H ]t =T = 0
Linha Terminal Vertical Truncada Agora considere o problema em que o tempo terminal fixo, mas o estado terminal livre para variar, apenas sujeito a yT y min onde y min denota um dado nvel mnimo permissvel para y. Apenas dois tipos de resultados so possveis na soluo tima: y *T > ymin ou y *T = ymin . No primeiro resultado, a restrio terminal automaticamente satisfeita. Assim, a condio de transversalidade para o problema com um linha terminal vertical regular usaria (7.33) (T) = 0 para
y *T > ymin
22 No outro resultado, y *T = ymin , desde que a restrio terminal atingida, os caminhos admissveis da vizinhana de y consistiram apenas daqueles que tem estado terminal yT y min . Se avaliamos (7.25) para t = T e permitimos y *T = ymin , obtemos yT = ymin + q(T) Assumindo que q(T) > 0 sobre a curva de perturbao q(t)9, a exigncia yT y min impe 0. Mas, pelas condies de Kuhn-Tucker, a no negatividade de alteraria a condio de primeira ordem d / d = 0 para d / d 0 no nosso problema de maximizao10. Seguese que (7.30) iria gerar agora uma condio de transversalidade de desigualdade
(T )yT 0
Ao mesmo tempo, ns podemos ver de (7.26) que, dado 0, a exigncia de yT y min que a mesma que yT y *T no presente contexto implica yT 0 . Assim, a precedente condio de transversalidade de desigualdade reduz-se a (7.34)
(T ) 0 para y *T = ymin
Combinando (7.33) e (7.34) e omitindo o smbolo *, podemos finalmente escrever um simples enunciado conciso da condio de transversalidade como segue: (7.35)
(T ) 0
yT = ymin
(yT ymin )(T ) = 0
Note que a ltima parte desse enunciado representa a familiar condio de folga-complentar das condies de Kuhn-Tucker. Como no problema similar com uma linha terminal vertical truncada no clculo das variaes, a aplicao prtica de (7.35) no complicada como a condio possa parecer. Podemos sempre tentar primeiro a condio (T ) = 0 e checar se o resultante valor de y*T satisfaz a restrio terminal yT y min . Se sim, o problema est resolvido. Se no, colocamos ento y *T = ymin para satisfazer a condio de folgacomplementar e tratamos o problema como se fosse um problema com um ponto terminal dado. Linha Horizontal Terminal Truncada Seja o estado terminal fixo, mas permita o tempo terminal T variar sujeito a restrio T* Tmax, onde Tmax o valor mximo permitido de T um deadline* pr-estabelecido. Ento, ns temos T* < Tmax ou T* = Tmax, na soluo do tima.
9 10
Essa hiptese no influencia o resultado final do processo aqui deduzido. As condies de Kuhn-Tucker so explicadas em Alpha C. Chiang, Fundamental Methods of Matematical Economics, 3ed, McGraw-Hill, New York, 1984, Sc. 21.2 * NT. O termo deadline usual em controle timo no Brasil, seu significado pode ser grosseiramente traduzido como o instante onde tudo acaba.
23 No primeiro resultado, a restrio terminal no atingida, e a condio de transversalidade para o problema com uma linha terminal horizontal regular ainda vlido: (7.36)
[H ]t =T = 0
para T* < Tmax
Mas se T* = Tmax, ento por implicao todos os caminhos admissveis vizinhos do caminho y devem ter tempo terminal T* Tmax. Por razes anlogas s que conduziram ao resultado (7.34) para a linha terminal vertical truncada, possvel estabelecer a condio de transversalidade: (7.37)
[H ]t =T
0 para T* = Tmax
Combinando (7.36) e (7.374) e omitindo o smbolo *, obtemos o seguinte enunciado cresumido da condio de transversalidade: (7.38) EXEMPLO 1
[H ]t =T
T Tmas
(T Tmax )[H ]t +T
=0
Maximize sujeito a
V = u 2 dt
0
y = y+u y (0) = 1
y (1) = 0
Com pontos finais fixos, no necessitamos de condio de transversalidade nesse problema. Etapa i Desde que a funo Hamiltoniana no linear:
H = u 2 + ( y + u)
e desde que u no restrito, podemos aplicar a condio de primeira ordem
H = 2u + = 0 u
Isso gera a soluo u = / 2 ou, mais precisamente, (7.39)
1 u (t ) = (t ) 2
Desde que 2 H / u 2 = 2 negativa, essa soluo u(t) maximiza ou invs de minimizar H. Mas desde que a soluo expressa em termos de (t), devemos encontrar o caminho final de u(t) que ser determinado adiante.
24 Etapa ii Da equao de movimento de co-estado
=
conseguimos a soluo geral (7.40)
H = y
(t ) = ke t
(k arbitrria)
Para definir a constante arbitrria, tentamos resolver as condies de vizinhana, mas, infelizmente, para o problema de ponto terminal fixado, essas condies so ligadas a varivel y ao invs de . Assim, agora necessrio procurar primeiro dentro do caminho soluo de y.
A equao de movimento de y y = y + u . Usando (7.39) e (7.40), 1 entretanto, podemos re-escrever essa equao como y = y + ke t ou, 2
Etapa iii
y y=
1 t ke 2
Essa uma equao diferencial linear de primeira ordem com um coeficiente varivel e um 1 termo varivel, do tipo dy / dt + u (t ) y = w(t ) - aqui com u(t) = - 1 e w(t ) = ke t . Via uma 2 11 frmula padro, sua soluo pode ser encontrada como segue :
1dt 1dt 1 y (t ) = e c + ke t e dt 2 1 = et c + ke t e t dt 2
(7.41)
1 = et c ke 2t 4 1 = ce t ke t (c arbitrria) 4
11
Veja Alpha C. Chiang, Fudamental Methods of Mathematical Economics, 3 ed., Mc-Graw-Hill, New York, 1984, Sec. 14.3. Na execuo da integrao envolvida na aplicao da frmula, omitimos a constante de integrao sempre que elas podem ser includas sob outras constantes. Alternativamente, ns podemos encontrar a funo complementar e a integral particular separvel e ento combin-las. Com um termo varivel na equao diferencial, podemos obter a integral particular pelo mtodo dos coeficientes a determinar. (ibid., Sec. 15.6)
25 Etapa iv Agora as condies limites y(0)=1 e y(1)=0 so diretamente aplicveis, e elas nos do a seguinte valores definitivos para c e k:
c=
1 1 e2
k=
4e 2 1 e2
Conseqentemente, substituindo esses valores em (7.41), (7.40) e (7.37), temos a seguinte soluo definitiva para os trs caminhos timos:
1 t e 2 t e e 1 e2 1 e2 4e 2 t 2e 2 t * (t ) = e e u * (t ) = e 1 e2 1 e2 y * (t ) =
A procura pelas trajetrias de u*(t), y*(t) e *(t) no presente problema torna-se um processo entrelaado. Isso porque, diferente do problema bsico do controle timo, onde a condio de transversalidade (T) = 0 pode habilitar-nos a obter uma soluo definida do caminho de co-estado *(T) no estgio inicial do jogo, o problema do ponto terminal fixo no permite a aplicao das condies de fronteira sobre y(0) e y(T) at o estgio final do processo de soluo. EXEMPLO 2 Vamos considerar o exemplo precedente, com condio terminal y(1) = 0, substituda pela restrio T=1 y(1) 3
O problema ento aquele com uma linha terminal vertical truncada e a condio de transversalidade apropriada (7.35). Primeiro tentamos resolver esse problema como se sua linha terminal vertical no fosse truncada. Se y*(1) torna-se 3, ento o problema est resolvido; noutros casos, ns refazemos ento o problema colocando y(1) = 3. Etapa i O Hamiltoniano permanece o mesmo como no Exemplo 1 e a soluo para varivel de controle ainda (7.42)
1 u (t ) = (t ) 2
[de (7.39)]
Etapa ii Embora que a soluo geral para seja ainda
(t ) = ke t
[de (7.40)]
podemos agora usar a condio de transversalidade (T) = 0 ou (1) = 0 para definir a constante arbitrria. O resultado k = 0, portanto, *(t) = 0
26 Segue-se ento de (7.42) que (7.44) u*(t) = 0
Etapa iii Da equao de movimento para y, encontramos
y = y + u = y [por (7.44)]
A soluo geral para essa equao diferencial
y (t ) = ce t
onde a constante c pode ser definida como c = 1 pela condio inicial y(0) = 1. Assim, o caminho timo de estado (7.45)
y * (t ) = et
Etapa iv Resta checar (7.45) contra a restrio terminal. No ponto terminal fixo T = 1, (7.45) nos d y * (t ) = e . Isso, infelizmente, viola a restrio terminal y(1) 3. Assim, para satisfazer a condio de transversalidade (7.35), temos que colocar y(1) = 3 e resolver o problema como um problema com um ponto terminal fixo. Note que tendo a restrio terminal permanecido T = 1, y(1) 2, ento (7.45) teria sido uma soluo aceitvel. EXEMPLO 3
V = 1dt
0
y = y+u y (0) = 5 y (T ) = 11 u (t ) [1,1]
livre
Esse exemplo ilustra o problema com uma linha terminal horizontal. Mais ainda, ele ilustra o tipo de problema conhecido como problema do tempo timo, cujo objetivo atingir algum alvo preestabelecido num montante de tempo mnimo. A natureza de tempo-timo do problema transmitida pelo funcional objetivo:
Etapa i (7.46)
1dt = [ t ]0 = T
Claramente, maximizar essa integral minimizar T. Para comear, forme o Hamiltoniano
H = 1 + ( y + u )
27 Pelo fato da funo H ser linear em u, a condio H / u = 0 inaplicvel. E, com a varivel de controle confinada ao intervalo fechado [-1,1], espera-se que o valor timo de u em qualquer ponto do tempo seja um valor limite, ou -1 ou 1. Especificamente, se > 0 (H uma funo crescente de u), ento u* = 1 (limite superior); mas, se < 0, ento u* = - 1. Como terceira possibilidade, se = 0 para algum valor de t, ento o Hamiltoniano ser traado num grfico contra u como uma linha horizontal, e u* ser indeterminado neste ponto do tempo. Essa relao entre u* e pode ser sucintamente capturada pela chamada funo sinal, denotada pelo smbolo sgn e definida como segue:
(7.47)
y = sgn x
1 > y = indeterminado se x =0 1 <
Note que se y uma funo sinal de x, ento y (se determinado) pode tomar apenas um dos dois valores, e o valor de y depende do sinal (no da magnitude) de x. Aplicado ao presente problema, essa funo resulta em (7.48)
1 > u* = sgn ou u* = se 0 1 <
Mais uma vez, encontramos que necessrio um conhecimento de antes de u poder ser determinado. Etapa ii A equao de movimento da varivel de co-estado , de (7.46)
=
que integrada d (7.49)
H = y
(t ) = ke t
(k arbitrria)
Nesse resultado, (t), sendo exponencial, pode tomar apenas um nico sinal algbrico o sinal da constante k. Conseqentemente, excetuando a eventualidade de k = 0 isto (t) = 0 para todo t (o que eventualmente, de fato, no ocorre aqui), u* deve ser determinado e aderir a um nico sinal qualquer, um nico valor constante em concordncia com a funo sinal. Por essa razo, ainda que a linearidade do Hamiltoniano na varivel de controle u resulte numa soluo de fronteira no presente exemplo, ela no produz o fenmeno bang-bang. Ocorre que o indicativo para o sinal de k reside na condio de transversalidade [H ]t =T = 0 . Usando o H em (7.46), o em (7.49) e a condio terminal y(T) = 11, ns podemos escrever a condio de transversalidade como
1 + ke T (11 + u*) = 0
28
Desde que u* ou 1 ou -1, a quantidade (11 + u*) deve ser positiva, como e T . Entretanto, k deve ser positivo para satisfazer essa condio. Ento segue-se que (t) > 0 para todo t, e que (7.50) u*(t) = 1
Etapa iii Com u* = 1 para todo t, podemos expressar a equao de movimento da varivel estado, y = y + u , como
y y =1
Isso se enquadra no formato de uma equao diferencial de primeira ordem com coeficiente constante e como termo constante, dy / dt + ay = b aqui com a = -1 e b = 1. Sua soluo definitiva nos d o caminho timo y12
(7.51)
b b y * (t ) = y (0) e at + a a = 6e t 1 [ y (0) = 5]
Etapa iv Tendo obtido os caminhos do controle timo e do estado u*(t) e y*(t), procuramos a seguir por *(t). Para esse propsito, primeiro retornamos condio de transversalidade [H ]t =T = 0 para fixar o valor da constante k. Considerando (7.50) e (7.51), a condio de transversalidade agora se reduz a
1 + ke T (6e T 1 + 1) = 0
Portanto k = (7.52)
ou
6k = 1
1 . Substituindo ento esse resultado em (7.49) produz o caminho timo 6
* (t ) = e t
1 6
Etapa v Os trs caminhos timos em (7.50), (7.51) e (7.52) retratam a soluo completa par o presente problema exceto para o valor de T*. Para calcul-lo, lembre que o valor do estado terminal estipulado em y(T) = 11. Disso, em conjunto com o caminho y*(t) obtido anteriormente, nos diz que 11 = 6eT 1 ou eT = 2 . Consequentemente,
12
A frmula soluo deduzida em Alpha C. Chiang, Fundamental Methods of Mathematical Economics, 3ed. Mc-Graw- Hill, New York, 1984 Sec. 14.1
29
T = ln 2( 0,6931) Os caminhos timos para as vrias variveis so facilmente desenhados. Deixamos isso para o leitor.
A Constncia do Hamiltoniano em Problemas Autnomos Todos os exemplos discutidos previamente partilhavam em comum a caracterstica de que os problemas eram autnomos, isto , as funes no integrando e f na equao de movimento no continham t como um argumento explcito. Uma importante conseqncia dessa caracterstica que o Hamiltoniano timo o Hamiltoniano avaliado ao longo dos caminhos timos de y, u e ter um valor constante no tempo. Para ver isso, primeiro vamos examinar a derivada com respeito ao tempo do Hamiltoniano H (t , y, u, ) no caso geral:
dH H H H H = + y+ u+ dt t y u
Quando H maximizado, temos H u = 0 (para uma soluo interior) ou u = 0 (para uma soluo de canto). Assim o terceiro termo do lado direito desaparece. Mais ainda, o H H princpio do mximo tambm estipula que y = e = . Portanto, o segundo e o quarto termos do lado direito se cancelam. O resultado lquido que H*, o Hamiltoniano avaliado ao longo do caminho timo em todas as variveis, satisfaz a equao
(7.53)
dH * H * = dt t
Esse resultado vlido em geral, para ambos os problemas autnomos e no autnomos. No caso especial de um problema autnomo, como t est ausente das funes F e f como um argumento explcito, o Hamiltoniano tambm no deve conter esse argumento. Conseqentemente, ns temos H / t = 0 , portanto (7.54)
dH * =0 dt
ou
H * = constante
[para problemas autnomos]
Esse resultado de uso prtico num problema autnomo com uma linha terminal horizontal. Espera-se normalmente que a condio de transversalidade [H ]t =T = 0 seja vlida apenas para tempo terminal. Mas se o Hamiltoniano uma constante na soluo tima, ento ele deve zero para todo t e a condio de transversalidade pode ser aplicada a qualquer ponto do tempo. No exemplo 3, por exemplo, ns acharemos que
1 H * = 1 + * ( y * +u*) = 1 + e t 6e t 1 + 1 = 0 6
30 Esse valor zero de H* prevalece indiferentemente do valor de t, o que mostra que a condio de transversalidade de fato satisfeita para todo t. EXERCCIOS 7.4 1. Ache os caminhos timos das variveis de controle, estado e co-estado para
Maximize sujeito a
(t 2 + u 2 )dt y (T ) = 5 T livre
y=u y (0) = 4
2. Ache os caminhos timos das variveis de controle, estado e co-estado para
3 ydt
0
y = y+u y (0) = 5 y (4) 300 0 u(t ) 2
3. Ns desejamos nos mover do ponto inicial (0,8) no plano ty para alcanar o valor do estado terminal y(T) = 0 logo que possvel. Formule e resolva o problema, assumindo que dy / dt = 2u , e que o conjunto de controle o intervalo fechado [-1,1] 4. Ache o caminho do controle timo e o estado timo correspondente que minimiza a distncia entre o ponto de origem (0,0) e uma curva terminal y(T ) = 10 T 2 , T > 0 . Faa um grfico da curva terminal e do caminho y*(t). 5. Demonstre a validade da condio de transversalidade (7.37) para o problema com uma linha terminal horizontal truncada. 7.5 COMPARAO DO CLCULO DAS VARIAES E DA TEORIA DO CONTROLE TIMO Ns mostramos anteriormente em (7.2) e (7.2) que um problema bsico de controle timo pode ser transladado para um problema equivalente de clculo das variaes. Ser maravilhoso se, em tal problema, as condies de otimalidade requeridas para o princpio do mximo tambm forem equivalentes quelas do clculo das variaes. A resposta que elas realmente so. Para o problema (7.55), a funo Hamiltoniana (7.55)
H = F (t , y, u ) + u
Assumindo que essa funo seja diferencivel com respeito a u, podemos listar as seguintes condies para o princpio do mximo:
31
(7.56)
H = Fu + = 0 u H y= =u H = = F y y (T ) = 0
A primeira equao em (7.56) pode ser re-escrita como = Fu . Mas, devido a segunda equao aqui, ela pode ser re-escrita como (7.57)
= Fy
Diferenciando (7.57) com respeito a t produz
d Fy dt
Entretanto, a terceira equao em (7.56) d uma outra expresso para . Pela igualdade das duas expresses, terminamos com a simples condio
F y
que idntica a equao de Euler (2.18).
d Fy = 0 dt
Quando o Hamiltoniano maximizado com respeito a u, a condio H / u ser acompanhada pela condio de segunda ordem 2 H / u 2 0 . Alm disso, a diferenciao de H / u na expresso (7.56) produz
2H = Fuu = Fyy 0 u 2
Isso, claro, a condio necessria de Legendre. Assim, o princpio do mximo perfeitamente consistente com as condies do clculo das variaes. Agora, lancemos um olhar sobre as condies de transversalidade. Para o problema do controle com linha terminal vertical, a condio de transversalidade (T) = 0. Por (5.57), entretanto, isso pode ser re-escrito como [ Fy ]t =T = 0 , ou, equivalentemente,
[ Fy ]t =T = 0
32 Novamente, isso precisamente a condio de transversalidade no clculo das variaes apresentada em (3.10). Para o problema com linha terminal horizontal, a condio de transversalidade do controle timo [H ]t =T = 0 . Observando (7.55), isso significa [F + u ]t =T = 0 . Usando (7.56) novamente aps a substituio de y por u, contudo, podemos transformar esse condio em
[F F y ]
y
t =T
=0
Exceto por essa ligeira diferena na simbologia, esta precisamente a condio de transversalidade sob o clculo das variaes dada em (3.11). Pode tambm ser mostrado que a condio de transversalidade para o problema com uma curva terminal yT = (T ) sob a teoria do controle timo pode ser transladada para a correspondente condio sob o clculo das variaes e vice-versa. Os detalhes da demonstrao so, todavia, deixados para o leitor. 7.6 A POLTICA DO CICLO DE NEGCIOS Aplicaes do princpio do mximo a problemas econmicos cresceram rapidamente entre 1965 e 1975, e a tcnica tem se tornado bastante comum. Suas aplicaes alcanam inteiramente das reas mais clssicas na macro e microeconomia at tpicos como indstria de pesca, planejamento urbano e controle da poluio. Na presente seo, vamos introduzir um modelo interessante de William Nordhaus13, que mostra que, numa democracia, um partido poltico da situao que tenta impedir o partido (ou partidos) rival de tir-lo do poder encoraja a busca por polticas que iro dar uma ateno particular s taxas de desemprego e de inflao a cada perodo eleitoral. A repetio de tal padro em perodos eleitorais sucessivos ir ento se manifestar, como uma srie de ciclo de negcios unicamente enraizada no jogo dos polticos. A Funo Voto e o Tradeoff de Phillips O partido da situao, no controle do governo nacional, obrigado, numa democracia, a perseguir polticas que agradem a uma maioria de eleitores no intuito de obter a vitria nas eleies. No presente modelo, a ateno focada apenas sobre polticas econmicas, na verdade em apenas duas variveis econmicas: U (a taxa de desemprego) e p (a taxa de inflao). Como os efeitos malficos do desemprego e da inflao do a impresso de serem a primeira preocupao econmica do eleitorado, essa escolha do foco certamente razovel. Assume-se que a reao dos eleitores a quaisquer valores de U e p percebidos est incorporada na funo voto (agregada).
13
William Nordhauss: The Political Business Cycle. Review of Economics Studies, April 1975, pp. 169 190.
33 p(%)
Menor
Maior
U(%) FIGURA 7.6

0
(7.58)
= (U,p)
(U < 0 p > 0)
onde uma medida do poder dos votos ganhos do partido da situao. As derivadas parciais de com respeito a cada argumento so negativas, porque altos valores de ambos U e p conduzem a perda de votos. Esse fato refletido na Fig. 7.6, onde, fora das trs curvas de isovotos ilustradas, a mais alta associada a um baixo . A noo da curva isovoto ressalta o fato que, no lado poltico, existe um tradeoff entre as duas variveis U e p. Se o partido da situao desagrada os eleitores pela produo de uma alta inflao, ele pode esperar recuperar os votos perdidos via uma reduo suficiente na taxa de desemprego. A parte do tradeoff poltico, as duas variveis em considerao tambm so ligadas uma a outra por um tradeoff econmico via relao de Phillips com expectativasaumentadas (7.59)
p = (U ) +
( < 0, 0 < 1)
onde denota a taxa esperada de inflao. Assume que as expectativas so formadas adaptativamente, de acordo com a equao diferencial (7.60)
= b( p )
b>0
No final das contas, temos agora trs variveis, U, p e . Mas destas, quais devero ser consideradas como variveis de estado e como variveis de controle? Para uma varivel qualificar-se como varivel de estado, ela deve vir com uma dada equao de movimento no problema. Como (7.60) constitui uma equao de movimento para , podemos tomar como varivel de estado. A varivel U, por outro lado, no vem com uma equao de movimento. Mas como U pode afetar p via (7.59) e assim dirigir dinamicamente via (7.60), ns podemos us-la como varivel de controle. Usar U como uma varivel de controle, porm, requer a suposio implcita de que o governante no poder tem a habilidade de implementar qualquer taxa alvo de desemprego que ele escolha em qualquer
34 ponto no tempo. Como para a varivel remanescente, p, (7.59) mostra que seu valor em qualquer tempo t ser determinado aps os valores das variveis de estado e controle serem conhecidos. Portanto, no poderemos v-la nem como varivel de estado nem como varivel de controle, mas, semelhante a , apenas como uma funo das outras duas variveis. O Problema do Controle timo Suponha que um partido ganhou as eleies no tempo t = 0, e que a prxima eleio est para acontecer T anos mais tarde em t = T. O partido vencedor tem ento T anos no total para impressionar os eleitores com suas realizaes (ou com o que possa aparentar ser isto) e como isso ganhar seus votos. A qualquer tempo do perodo [0,T], o par de valores realizados de U e p determinaro um valor especifico de . Todos esses valores de , em diferentes pontos do tempo, devero entrar no funcional objetivo do partido da situao. Mas, os vrios valores devem ser ponderados diferentemente dependendo do tempo em que ocorram. Se os eleitores tm uma memria coletiva curta e so mais influenciados por eventos que ocorram prximos ao perodo eleitoral, ento, devero ser atribudos pesos maiores aos valores de da parte posterior do perodo [0,T] do que queles que vm antes. Ns podemos ento formular o problema do controle timo do partido da situao como segue:
Maximize
(7.61)
(U , p)e
0
rt
dt
sujeito a e
p = (U ) + a = b( p ) (0) = 0 (T ) livre ( 0,T dados)
Alguns comentrios devem ser feitos sobre (7.61). Primeiro, ao sistema de ponderao dos valores pertinentes a diferentes pontos no tempo foi dado a forma especfica de uma funo exponencial e rt , onde r > 0, denota a taxa de queda de memria. Essa funo mostra que os valores de para pontos posteriores do tempo so mais fortemente ponderados. Note que, em contraste com a expresso e t , o que temos aqui no um fator de desconto, mas seu inverso. Segundo, ns conservamos a relao de Phillips de expectativas aumentadas no enunciado do problema. No momento, ns no estamos equipados para tratar com tal restrio. Felizmente, a varivel p pode ser facilmente eliminada pela substituio daquela equao na funo voto e na equao de movimento. Ento a equao de p desaparecer como restrio separada. Terceiro, como indicam as condies de fronteira, o partido da situao encontra uma linha terminal vertical, devido ao T (o tempo da eleio) est predeterminado. Quarto, mesmo que a taxa de desemprego seja necessariamente no negativa, nenhuma restrio de no negatividade foi de fato colocada na varivel de controle U. O plano e isso uma estratgia freqentemente usada no impor nenhuma restrio e deixar a soluo por ela mesma cair fora. Se U*(t) vier a ter valores economicamente aceitveis para todo t, ento no haver motivo para preocupao; se no, e somente se no, ns teremos que modificar a formulao do problema.
35 Como declarado em (7.61) o problema contm funes gerais e assim no pode produzir uma soluo quantitativa. Para resolver o problema quantitativamente, Nordhaus assume as seguintes formas funcionais especficas: (7.62) (7.63)
(U , p) = U 2 hp
p = ( j kU ) + a
(h > 0)
( j, k > 0,0 < a 1)
De (7.62) pode ser visto que as derivadas parciais de so de fato negativas. Em (7.63), percebemos que relao de Phillips (U ) foi linearizada. Usando essas funes especficas, e aps substituir (7.63) em (7.62), agora temos o problema especfico:
T
Maximize
(7.64)
(U 2 hj + hkU ha )e rt dt
sujeito a e
= b[ j kU (1 a) ] (0) = 0 (T ) livre ( 0,T dados)
Maximizando o Hamiltoniano O Hamiltoniano (7.65)
H = U 2 kj + hkU ha e rt + b[ j kU (1 a) ]
Maximizando com respeito a varivel de controle U, temos a equao
H = ( 2U + hk )e rt bk = 0 U
Isso implica no caminho de controle (7.66)
U (t ) =
1 k (h be rt ) 2
2H = 2e rt < 0 , o caminho de controle em (7.66) de fato maximiza H em todo 2 U ponto do tempo, como requer o princpio do mximo. A presena de na soluo de U(t) requer agora uma procura pelo caminho (t).
Desde que O Caminho do Co-estado timo A procura pelo caminho do co-estado comea com a equao de movimento
36
=
Quando re-escrita na forma
H = haert + b(1 a)
b(1 a) = hae rt
a equao prontamente reconhecida como uma equao diferencial linear de primeira ordem com um coeficiente constante mas um termo varivel. Empregando os mtodos padro de soluo14, ns podemos achar a funo complementar c e a integral particular como sendo, respectivamente,
c = Ae b (1a )t (A arbitrrio)
=
Segue que a soluo geral para (7.67)
ha rt e B
(B r b + ab )
(t ) = c + = Aeb (1a )t +
ha rt e B
Note que as duas constantes A e B so fundamentalmente diferentes na sua natureza; B meramente um smbolo taquigrfico que escolhemos para simplificar a notao, mas A uma constante arbitrria a ser definida. Para definir A, podemos fazer uso da condio de transversalidade para o problema de linha terminal vertical, (T) = 0. Pondo t = T em (7.67), aplicando a condio de transversalidade e resolvendo para A, encontramos que A = ( ha / B )e BT . Segue-se que a soluo definitiva o caminho do co-estado timo (7.67)
* (t ) =
ha rt BT +b (1a )t [e e ] B
O Caminho do Controle timo Agora que encontramos *(t), tudo que se tem a fazer substituir (7.67) em (7.66) para deduzir o caminho do controle timo. O resultado , aps simplificaes, (7.68)
14
U * (t ) =
kh [(r b) + bae B (T t ) ] 2B
Veja Alpha C. Chiang, Fundamental Methods of Mathematical Economics, 3ed. Mc-Graw- Hill, New York, 1984 Sec. 14.1 (para funo complementar) e Sec 15.6 (para a integral particular)
37
esse caminho de controle que o partido da situao deve seguir no interesse de sua reeleio no ano T. Quais so as implicaes econmicas desse caminho? Primeiro, notemos que U* uma funo decrescente de t. Especificamente, temos (7.69)
dU * 1 = khbae B (T t ) < 0 dt 2
porque k, h, b e a so todas positivas, como a expresso exponencial. A poltica econmica maximizadora de votos , consequentemente, estabelecer um alto nvel de desemprego imediatamente aps vencer a eleio em t = 0 e ento deixar a taxa de desemprego cair persistentemente por todo o perodo eleitoral [0,T]. De fato, os nveis timos de desemprego no tempo 0 e no tempo T podem ser precisamente determinados. Eles so
U * (0) = U * (T ) =
kh [(r b) + bae BT ] 2B
kh kh [(r b) + ba ] = 2B 2
Note que o nvel terminal de desemprego, kh / 2 uma quantidade positiva. E desde que U*(T) representa o ponto mais baixo em todo o caminho U*(t), os valores de U* para todos os valores de t em [0,T] devem ser uniformemente positivos. Isso significa que a estratgia de no impor restries deliberadamente na varivel U no causa nenhum incmodo relativo ao sinal de U no presente caso. Entretanto, para ser economicamente significativo, U*(0) deve ser menor que a unidade ou mais realisticamente, menor que alguma taxa mxima de desemprego tolervel Umax < 1. A menos que os valores dos parmetros sejam tais que U*(0) Umax, o modelo necessitar ser reformulado para incluir a restrio U * (t ) [0,U max ]. O tpico caminho do desemprego timo, U*(t), ilustrado na Fig 7.7, onde tambm mostramos que a repetio de padres similares U*(t) sobre sucessivos perodos eleitorais geram ciclos dos negcios polticos. Entretanto, a curvatura do caminho U*(t) nem sempre cncava como na Fig. 7.7. Pois, por diferenciao de (7.69) com respeito a t, podemos ver que (7.70)
> d 2U * 1 = BkhbaeB (T t ) = 0 < dt 2 2
quando
B=0
<
>
38 U*
2T
3T
FIGURA 7.7
Se, para ilustrao, r = 0,03, b = 0,30 e a = 0,70, ento B = r b + a b = 0,06 e o caminho U*(t) ser cncavo. Porm, um valor positivo de B mudar a curvatura para outra forma. E, com mudanas nos parmetros em perodos eleitorais diferentes, tanto a posio quanto a curvatura dos caminhos U*(t) em sucessivos perodos eleitorais podem mudar bastante. Todavia, a poltica do ciclo de negcios tender a persistir. O Caminho do Estado timo A tendncia cclica na varivel de controle U inspirada politicamente deve tambm verterse sobre a varivel de estado e consequentemente tambm para a taxa real de inflao p. O padro geral seria de uma taxa de inflao tima relativamente menor no comeo de cada perodo eleitoral, mas sofrendo uma subida persistente. Noutras palavras, o perfil temporal de p* tende a ser oposto ao de U*. Mas no iremos deduzir o caminho timo da taxa de inflao aqui. O leitor est lembrado que as concluses do presente modelo como aquelas de alguns outros modelos esto intimamente ligadas s suposies adotadas. Em particular, as formas especficas escolhidas para a funo voto em (7.62) e a relao de expectativas aumentadas de Phillips (7.63) indubitavelmente exerce uma importante influncia sobre a soluo final. Suposies alternativas tais como mudana no termo linear - hp em (7.62) para - hp 2 so provveis de modificar significativamente tanto a soluo U*(t) quanto a soluo p*(t). Mas tambm provvel que a formulao do problema seja mais complicada. EXERCCIOS 7.6 1. (a) O que acontece no modelo de Nordhaus se o caminho do controle timo for caracterizado por dU * / dt = 0 para todo t? (b) Quais valores dos vrios parmetros faro dU * / dt faro ser zero? (c) Interprete economicamente os valores encontrados na parte (b). 2. Qual valor do parmetro que causa dU * / dt = 0 causar tambm U*(t) = 0 para todo t? Explique as implicaes econmicas e racionais para tal resultado.
39 3. Como uma mudana no valor do parmetro r (taxa de decaimento da memria do voto) afeta a inclinao do caminho de U*(t)? Discuta as implicaes econmicas desse resultado. [Note: (B r b + b)] 4. Elimine o termo e rt na funo objeto em (7.64) e escreva o novo problema (a) Resolva o novo problema efetuando os mesmos passos como aqueles ilustrados no texto do problema original (b) Verifique seus resultados colocando r = 0 no resultado do modelo original especialmente (7.68) e (7.69) 7.7 USO DA ENERGIA E QUALIDADE AMBIENTAL Quando uma economia revestida com um recurso que exaurvel, digamos, combustvel fssil, certamente conveniente a coletividade ser concernente sobre a questo de como a ofertada limitada do recurso melhor do que ser alocado para uso todo tempo. Discutimos algumas das controvrsias envolvidas na Sec. 6.3 com o mtodo do clculo das variaes. Mas, os cidados da mundo atual so tambm intensivamente concernentes quanto qualidade do meio ambiente em que eles vivem. Se o uso de combustvel exaurvel gera poluio como um derivado, ento qual o caminho timo do tempo para o uso da energia? Ilustramos agora como tal questo pode ser includa na teoria do controle timo com um modelo de Bruce A. Forester15. A Funo Utilidade Social Denote por S(t) o estoque de combustvel e E(t) a taxa de extrao do combustvel (e uso da energia) em qualquer tempo t. Ento, temos: (7.71)
S = E
O uso de energia, E, possibilita a produo de bens e servios para o consumo, C, que gera utilidade, mas tambm gera um fluxo de poluio., P, que cria desutilidade. Ao invs de escrever a funo utilidade simplesmente como U(E), como fizemos na seo introdutria desse captulo, portanto, nossa funcional objetivo ir conter dois argumentos, C(E) e P(E). Forester, especifica a funo consumo e a funo poluio como segue: (7.72) (7.73)
C = C( E) P = P(E)
(C > 0, C < 0) (P > 0, P > 0)
15
Bruce A. Forester, Optimal Energy Use in a Polluted Enviroment, Journal of Enviromental Economics and Management, 1980, pp 321 - 333. Enquanto esse trabalho apresenta trs diferentes modelos, aqui confinaremos nossa ateno exclusivamente no primeiro deles, que assume uma fonte simples de energia produzindo um poluente no acumulativo. Outro modelo, tratando poluio como um estoque varivel e envolvendo duas variveis de estado ser discutido na Sec. 8.8.
40 Enquanto o uso da energia cresce a uma taxa decrescente, ela gera poluio a uma taxa crescente. Nesse modelo particular, poluio assumida por simplicidade ser no acumulativa; isto , ela um fluxo que dissipa e no forma estoque. Isso exemplificado pelo tipo auto-emisso de poluio. A funo utilidade social depende do consumo e da poluio, com derivadas como segue: (7.74)
U = U (C, P)
(UC > 0, UP < 0, UCC < 0, UPP < 0, UCP = 0)
A especificao de U C > 0 e U CC < 0 , mostra que a utilidade marginal do consumo positiva, mas decrescente. Ao contrrio, a especificao de UP < 0 e U PP < 0 revela que a utilidade marginal da poluio negativa e diminui (dado um acrscimo particular em P, U P pode diminuir de, digamos, 2 para 3). Em termos de desutilidade marginal de P( U P ) , portanto, U PP < 0 significa aumento na desutilidade marginal. Desde que ambos C e P dependem de E, a utilidade social depende, em ltima anlise, da energia usada exclusivamente positivamente via consumo e negativamente via poluio. Isso significa que C e P podem ambos ser substitudos deixando E como o primeiro candidato a varivel de controle. Outra nica varivel no modelo, S, aparece em (7.71) na forma derivada. Desde que uma varivel dinamicamente direcionada para varivel de controle E, claro que S faz aqui o papel de varivel de estado. O Problema do controle timo Se um Conselho de Energia indicado para planejar e desenhar o caminho do tempo timo do uso da varivel energia E sobre um especificado perodo de tempo [0,T], o problema de otimizao dinmica deve tomar a forma:
Maximize
(7.75)
U [C ( E ), P( E )]dt
0
sujeito a e
S = E S (0) = S 0
S (T ) livre ( S 0, T dados)
Essa particular formulao no permite fator de desconto no integrando, uma prtica em Ramsey tradicional. E o Conselho de Energia compete a prudncia de escolher o estoque terminal S(T), sujeito apenas a restrio imposta pela natureza de no negatividade. Desde que o tempo terminal fixado, o problema se caracteriza por linha vertical terminal truncada. Com uma simples varivel de controle E e uma simples varivel de estado S, o problema pode ser resolvido facilmente. Maximizao do Hamiltoniano A funo Hamiltoniana
41 (7.76)
H = U [(C ( E ), P( E )] E
envolve funes diferenciais no lineares U, C e P. Assim, podemos maximizar H com respeito a varivel de controle simplesmente colocando sua derivada primeira igual a zero:
H = U C C ( E ) + U P P ( E ) = 0 E
Quando resolvido, essa equao expressa E em termos de . Para fazer tal como em (7.77) maximizar ao invs de minimizar o Hamiltoniano, verificamos o sinal 2 H / 2 E . Desde que UC e UP so, como U, dependente de E, a segunda derivada
2H = U CCC 2 ( E ) + U C C + U PP P2 + U P P < 0 2 E
O sinal negativo garante que H maximizado. Os caminhos timos do co-estado e do controle
[por (7.72), (7.73) e (7.74)]
Para extrair mais informao sobre E de (7.77), portanto, precisamos olhar dentro do caminho do tempo de . O princpio do mximo nos diz que a equao de movimento para
H = 0 implicando (t) = c (constante) S
Para definir c, podemos recorrer a condio de transversalidade. Para o problema em mos, com linha vertical terminal truncada, a condio toma a forma: (7.79) (T) 0 S(T) 0 (T) S(T) = 0 [por (7.35)]
Em aplicaes prticas desse tipo de condio, o passo inicial colocar (T) = 0 (como se linha terminal no fosse truncada) para ver com soluo ir trabalhar. Desde que (T) constante por (7.78), para colocar (T) = 0 realmente colocar (t) = 0 para todo t. Com (t) = 0 (7.77) se reduz a uma equao numa simples varivel E, (7.80)
U C C ( E ) + U P P( E ) = 0
que, em princpio, pode ser resolvido pelo caminho do controle timo. Desde que essa equao independente da varivel t, sua soluo constante no tempo: (7.81) E*(t) = E* (uma constante especfica) [se *(t) = 0]
42 Se essa soluo aceitvel do ponto de vista de S(T) 0 a restrio , todavia, ainda causa para ser estabelecida. Entretanto, isso usado para examinar o significado econmico de (7.80). O primeiro termo, U C C (E ) , mede o efeito da troca em E sobre U via C. Isto , representa a utilidade marginal do uso da energia atravs de sua contribuio para o consumo. Similarmente, o termo U P P(E) expressa a desutilidade marginal do uso da energia atravs de seu efeito poluio. O que (7.80) faz , entretanto, direcionar o Conselho de Energia para selecionar o valor E* que equilibra a utilidade marginal e a desutilidade marginal do uso da energia, tanto quanto a familiar regra Custo Marginal = Receita Marginal requer para uma firma equilibrar os efeitos de custo e receita da produo. O Caminho do estado timo Lembre-se de verificar se a soluo E* em (7.81) pode satisfazer a restrio S(T) 0. Para esse propsito, devemos encontrar o caminho do estado S(t). Com o uso da energia constante, a equao de movimento S = E pode ser realmente integrada para gerar S (t ) = Et + k (k arbitrria) Mais ainda, colocando t = 0 nesse resultado, fcil ver que k representa o estoque inicial de combustvel S0. Assim, o caminho do estado timo pode ser re-escrito como (7.82)
S * (t ) = S0 Et
O valor de S*(t) em qualquer tempo claramente depende da magnitude de E*. Desde que as funes que temos trabalhado U(C,P), C(E) e P(E) so todas gerais, E* no pode assumir um valor especfico ou uma expresso paramtrica. Alm disso, podemos examinar a restrio S(T) 0 qualitativamente. Considere trs valores ilustrativos de E* na Fig. 7.8, onde E*1 < E*2 < E*3. Quando a taxa do uso da energia E*1 est verdadeiramente baixa, o estoque S*(t) aparece como uma linha reta de inclinao suave, tal que S*(t) seja positivo. Com uma alta taxa do uso de energia, por outro lado, o estoque de combustvel est caindo a zero no tempo T. Ainda assim, o Conselho de Energia usaria de sua autoridade. Mas, o outro caso, E*3, vinculando a exausto pr matura da dotao do combustvel, evidentemente viola a estipulao S(T) 0. Assim, se nossa soluo E* em (7.81)
43
S*(t)
S*(t)=S0 E*t
E*1 < E*2 < E*3
E*= E*1
Figura 7.8
E*= E*3 E*= E*2
tende ser como E*1 ou E*2, ento a condio de transversalidade (7.79) adequada e o problema solucionado. Mas se for como E*3, ento devemos colocar S(T) = 0 e resolver o problema como se fosse um com ponto terminal dado. Nesse evento, o valor E* pode ser diretamente encontrado de (7.82) colocando t = T e S(T) = 0: (7.83)
E* =
S0 =0 T
[se (7.81)viola S*(T) 0]
Esse novo E* est ilustrado por E*2 na Fig. 7.8. uma notvel caracterstica desse modelo que E*, a taxa do uso timo da energia, constante no tempo. Essa constncia de que E* prevalece mesmo que a restrio sobre o estoque terminal, S(T) 0, amarrada [como em (7.83)] ou no amarrada [como em (7.81)]. Que hiptese do modelo responsvel por esse resultado? A resposta cai na ausncia do fator de desconto. Se um fator de desconto introduzido [veja Prob. 3, Exerccio 7.7], o caminho E* ento ir ser decrescente no tempo, conquanto que *(t) > 0. Entretanto, no outro caso em que *(t) = 0, E* ser constante. Exerccio 7.7 1. Suponha que a soluo em (7.80) seja E*3 que insuficiente para satisfazer a restrio S(T) 0, e conseqentemente o Conselho de Energia forado a selecionar uma baixa taxa do uso de energia, E*2, por exemplo. (a) E*3 satisfaz a regra utilidade marginal = desutilidade marginal? (b) E*2 satisfaz a regra? Se no, E*2 caracteriza-se por utilidade marginal < desutilidade marginal ou utilidade marginal > desutilidade marginal? Explique. 2. Seja a condio terminal no modelo de Forester alterada de S(T) 0 para S(T) Smin >0. Como ser modificada a Fig. 7.8 para mostrar que E*1 resulta em S(T) > Smin , E*2 resulta em S(T) = Smin e E*3 resulta em S(T) < Smin? 3. Suponha que o Conselho de Energia decida incorporar um fator de desconto e t na funcional objetivo. (a) Escreva o novo Hamiltoniano e encontre as condies que iro maximizar o novo Hamiltoniano.
44 (b) Examine o caminho timo do co-estado. Voc conseguir obter um caminho constante como em (7.78)? (c) Se a condio de transversalidade (T) = 0 aplica-se, como ser transformado a condio de maximizao na parte (a)? Essa condio pode ser simplificada para (7.80)? O que voc pode concluir sobre E* nesse caso? (d) Se a condio de transversalidade (T) > 0 e S(T) = 0, por exemplo, como ser transformado a condio de maximizao do Hamiltoniano na parte (a)? Encontre a derivada dE / dt e deduza o caminho caracterstico de E*(t) para esse caso.

Teoria Do Controle Otimo Capitulo 7 Stamford

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Teoria Do Controle Otimo Capitulo 7 Stamford

Transféré par

Droits d'auteur :

Formats disponibles

1 Captulo 7 Controle timo: O princpio do mximo O clculo das variaes, o mtodo clssico para atacar problemas de otimizao dinmica,

y = f (t , y, u ) y (0) = A y (T ) livre ( A, T u (t ) U para todo t [0, T ]

F (t , y, u )dt equivalente a maximizar

para todo t [0, T ]

[equao de movimento para y ] [equao de movimento para ] [condio de transversalidade]

H (t , y, u * , ) H (t , y, u, ) para todo t [0, T ]

Isso produz a soluo6 (7.9)

Alm disso a diferenciao de H / u usando a regra do produto produz

* (t ) = 0 para todo t [0, T ]

Observando (7.9), ns tambm poderemos concluir que (7.11)

u * (t ) = 0 para todo t [0, T ]

Etapa iii Da equao de movimento y = u , estamos agora capacitados a escrever

H / u = 0 pode ser escrita como

y = y+u y (0) = 4 y (2) u (t ) U = [0,2]

Sua soluo geral 7

39,339 (b) 15,739 4,000

y y = 2 com valor inicial y(0) = 4

Na fase II, a equao de movimento para y y = y + 0 , ou

y *II y *[ ,2] = ce t (c arbitrria)

[por (7.18)] [por (7.19)]

y = y+u y (0) = 5 y (4) u (t ) U = [0,2]

+ u 2 dt y (1) livre u (t ) no restrito

v = (t ) (implicando que dv = dt ) w = y (t ) (implicando que dw = ydt )

T T (t ) ydt = (T ) yT + (0) y 0 + y (t )dt 0 0

= [ H (t , y, u, ) + y(t ) ]dt (T ) yT + (0) y0 0

para todo t [0, T ]

(t ) ydt = vdw , ns temos

T (t ) ydt = [ (t ) y (t )]T + y (t )dt 0

que coincide com o resultado no texto.

Alm disso, se T e yT so variveis, tambm teremos (7.26) T = T * + T e yT = y *T + yT (implicando

{H [t , y * + q(t ), u * + p(t ), ] + [ y * + q(t )]}dt (T ) yT + (0) y0

H H dT q(t ) + p(t ) + q(t )dt + [ H + y]t T u d y

(yT ymin )(T ) = 0

para T* < Tmax

24 Etapa ii Da equao de movimento de co-estado

Etapa ii Embora que a soluo geral para seja ainda

26 Segue-se ento de (7.42) que (7.44) u*(t) = 0

Etapa iii Da equao de movimento para y, encontramos

y = y+u y (0) = 5 y (T ) = 11 u (t ) [1,1]

Claramente, maximizar essa integral minimizar T. Para comear, forme o Hamiltoniano

1 > y = indeterminado se x =0 1 <

1 > u* = sgn ou u* = se 0 1 <

1 . Substituindo ento esse resultado em (7.49) produz o caminho timo 6

[para problemas autnomos]

2. Ache os caminhos timos das variveis de controle, estado e co-estado para

y = y+u y (0) = 5 y (4) 300 0 u(t ) 2

Diferenciando (7.57) com respeito a t produz

U(%) FIGURA 7.6

p = (U ) + a = b( p ) (0) = 0 (T ) livre ( 0,T dados)

( j, k > 0,0 < a 1)

= b[ j kU (1 a) ] (0) = 0 (T ) livre ( 0,T dados)

Maximizando o Hamiltoniano O Hamiltoniano (7.65)

Maximizando com respeito a varivel de controle U, temos a equao

(C > 0, C < 0) (P > 0, P > 0)

(UC > 0, UP < 0, UCC < 0, UPP < 0, UCP = 0)

[por (7.72), (7.73) e (7.74)]

H = 0 implicando (t) = c (constante) S

[se (7.81)viola S*(T) 0]

Vous aimerez peut-être aussi

y II y [ ,2] = ce t (c arbitrria)