Vous êtes sur la page 1sur 44

RECURSOS

ASIGNACIN
HORAS EXTRA:
TEORIA DE CONTROL DE PTIMA
EL SIGNIFICADO DE LA DINMICA
La teora de la esttica comparativa se refiere a las tasas instantneas de
cambio de variables como la eleccin de los parmetros (restricciones) que
enfrenta el cambio que toma las decisiones. En muchos casos (la mayora,
tal vez), esto proporciona una base aceptable para afirmar hiptesis
refutables extrapolando estos cambios instantneos en un intervalo finito.
As, por ejemplo, a pesar de que la derivacin matemtica de la ley de la
demanda de los cambios de precios com-compensada es, estrictamente
hablando, una declaracin acerca de la funcin de demanda a un precio
nico y el vector de ingresos, el supuesto adicional de que las propiedades
de curvatura subyacentes sostenga sobre un intervalo de valores nos
permite afirmar la ley de la demanda en su forma emprica til.
En algunos problemas, sin embargo, la mera declaracin del movimientomentos instantneos en variables de eleccin es insuficiente. El problema es
ms evidente en la capital el-ria, donde es la cantidad en capitaltpicamente duradero lo importante, y donde una toma de im portante se
refiere al nivel de cambio de flujo de servicio que se proporciona a travs
del tiempo. Por otra parte, es precisamente los cambios en la tasa de
utilizacin de los recursos en el tiempo que son de inters, en lugar de la
mera especificacin de la direccin inicial de cambio. Tales decisiones son
inherentemente dinmico; toda la trayectoria en el tiempo futuro de las
variables de eleccin cambios como se toman las decisiones en el presente.
La propiedad fundamental de los modelos dinmicos es que las decisiones
tomadas en el presente afectan las decisiones en el futuro

Algunas de las aplicaciones ms importantes de anlisis dinmico han sido


en el rea de la utilizacin de los recursos naturales. El tema de la eficiencia
(maximiza-cin riqueza de largo plazo) el uso de algn recurso, como el
pescado, que puede ser agotado por una amplia cosecha, es un ejemplo
prominente. Por esta razn, y porque nos permite ilustrar claramente las
cuestiones importantes que participan en este tipo de problemas, vamos a
utilizar esto como nuestro modelo prototipo de la utilizacin de recursos en
el tiempo.
En el Cap. 12, analizamos brevemente el problema de inversin fisheriana
de mx-imizing el valor presente de algn recurso, por ejemplo, rboles, con
funcin de crecimiento g (t), donde t - tiempo. La funcin objetivo es P - g (t)
e ~ ta; el problema se refiere a la longitud de tiempo que el recurso debe

ser dejado de crecer. Maximizacin de P con respecto a / produce la


condicin de primer orden r = g '/ g; los rboles se dejan crecer hasta que el
aumento en el valor de las acciones de cada ao cae al valor alternativo del
capital, dada por la tasa de inters r. Aunque se trata de un problema de
maximizacin "con el tiempo" no es realmente un problema dinmico. Slo
hay una decisin que tomar, y no hay vinculacin de esa decisin con
cualquier otra opcin (no hay ninguno, de hecho) a realizar en una fecha
posterior.
Incluso el caso de siembras repetidas (la denominada solucin Faustmann),
donde se aade un coste de oportunidad adicional, la de uso repetido de la
tierra a travs de la replantacin, es esencialmente un problema esttico. La
solucin de este problema, sin embargo, es sugestiva de la aproximacin
general a problemas dinmicos. Despus de la cosecha inicial, con valor de
g {t) e ~ rl, la poltica de "ptimo" es repetir la decisin anterior. Por lo
tanto, la funcin objetivo se hac

Despejando el tiempo que maximiza la riqueza de la cosecha se obtiene un


perodo de crecimiento ms corto que cuando el costo de oportunidad de la
tierra despus de la cosecha es cero, como en el modelo original de Fisher.
Ponga un poco ms en general, la poltica que maximiza el valor (en este
caso, la riqueza) de hoy de algunas extendida flujo de ingresos (tal vez
infinito) debe, despus de la primera cosecha, una poltica que maximice la
riqueza a partir de ese momento tambin. Haciendo caso omiso, por el
momento, exactamente cmo se llega al punto de la primera y sucesivas
cosechas, todo el camino no puede ser "ptimo" (riqueza maximizacin, en
este caso) a menos que el futuro despus de que la cosecha est
ptimamente programado tambin. De lo contrario, toda la decisin desde
el momento inicial de avance se puede mejorar simplemente reemplazando
el antiguo camino despus de la primera cosecha con el nuevo. Este
razonamiento fue enunciada por primera vez por el matemtico Richard
Bellman en la dcada de 1950 y es conocido como el, principio de
optimalidad. Esta idea se ha utilizado ampliamente en las ltimas dcadas
para analizar problemas donde las decisiones estn vinculados, es decir,
cuando una decisin en un perodo de tiempo afecta el nivel de alguna
variable relevante en el futuro. En ese caso, la replicacin sencilla de
decisiones anteriores no ser ptima; cada decisin impone una
"externalidad" en el futuro. Es slo entonces que un problema se convierte
verdaderamente dinmica

Para ilustrar estas cuestiones ms concretamente, considere un lago de


propiedad privada que contiene un stock de peces inicial x0. Supongamos
que el nico valor de este lago es el valor de la poblacin de peces en l. En
general, como los peces se cosechan en el tiempo, el tamao de la
poblacin de peces va a cambiar, y el valor del recurso variar

correspondientemente. Por otra parte, a menudo es el caso que a mayor


nmero de peces en el lago, ms fcil ser para su captura; por esta razn,
las decisiones de la cosecha en el presente pueden tener un efecto adicional
sobre el costo marginal de la pesca en el futuro y, por lo tanto, el valor
actual del recurso. Dado que el precio actual de la totalidad del recurso es el
valor capitalizado de todos los futuros beneficios menos los costos, las
decisiones tomadas "hoy" que afectan el costo de la pesca "maana" se
reflejan en el valor actual del recurso. Un dueo que tuvo en cuenta el costo
futuro de las decisiones tomadas en el presente probablemente no utilizar el
recurso de una manera que maximiza la riqueza. La situacin es
directamente anloga a la del ejemplo de Coase del ganado que deambulan
en la tierra de un granjero vecino y destruyen algunos cultivos. La eleccin
de la cantidad de ganado para elevar sin tener en cuenta el costo impuesto
a las tierras agrcolas dar lugar a una asignacin con menos valor a todos
los recursos (agrcolas y de ganado de produccin en conjunto) que si se
consideran los costos "externos". En el presente caso, los costes externos
son las impuestas en el futuro, tal vez en el mismo propietario como en el
presente.
Usemos la variable x (t) para denotar el stock de peces en el lago, en
cualquier momento t, donde, en un principio, xo = x (a). Fish se cosechan en
algn tipo de u (t), de ser elegido por el propietario del recurso. La variable
u (t) se denomina el control; es el camino de las decisiones tomadas (con
respecto a la recoleccin de peces, en este caso). Hacemos el supuesto
simplificador de que los peces se venden en el mercado mundial a un precio
p, supone constante, ahora y en el futuro. La cantidad de peces cosechados
depende de la poblacin de peces y la entrada de mano de obra y otros
factores. Asumimos una funcin de costos bien definida con las propiedades
usuales; c = c (x, u, w) se define, donde w es un vector de precios de los
factores. Por el momento, asumir un horizonte de planificacin finita para
que el propietario del lago maximiza el valor de los peces entre los tiempos
y al t \.
La hiptesis de la maximizacin del valor actual del recurso (la riqueza) es,
pues,
Maximizar

Sin embargo, el modelo no es todava completa porque no se ha


especificado la dependencia de la poblacin de peces en el futuro sobre la
tasa actual de cosecha. Como x (t) es el stock de peces en cualquier
momento, su derivado, x '{t), es la tasa de la accin de crecimiento o
disminucin en el tiempo t. En general, la tasa de variacin de las

existencias de peces depende de algn tipo de biolgico de crecimiento del


stock, G (x), y la tasa de la cosecha:

Adems, las restricciones a los valores de la variable de control se deben


especificar, por ejemplo, u {t)> 0. Nos dicen en general que u (t) debe
pertenecer a configurar algn control U. ltimo

el stock inicial de los peces, en este ejemplo), x (TQ) = xo, y tal vez una
condicin terminal sobre la accin, x (t \) = x \.
La ecuacin (20-1Z?) Define la dinmica de ste y de otros modelos. Se
llama la ecuacin de estado; x (t) es la variable de estado. La variable u (t)
se denomina la variable de control; es anloga a las variables de decisin de
la teora esttica. Esta es la variable de la que toma las decisiones elige, o
controles (por ejemplo, la tasa de cosecha, la tasa de inversin en capital
nuevo, o cualquier otro flujo que afecta el tamao de la poblacin de algn
recurso). Las variables de estado x (t) representa el tamao de la poblacin
de algn recurso en el tiempo t. La accin que existe en el tiempo t \, por
supuesto, depende de la existencia inicial y el camino de las decisiones u (t)
con respecto a las tasas de cosecha para t <t \. (Por lo general, pensamos
en opciones sobre u afectan al nivel de x, aunque es posible, en principio,
en el supuesto invertibilidad adecuado de las funciones, de imaginar la
eleccin de la poblacin de x en cada momento e inferir la u flujo que debe
ser implcita para lograr que de las acciones.) Las ecuaciones (20-1), ms
las condiciones en los extremos y un poco de control especificado
establecer U, son prototpico de los problemas de optimizacin dinmica.
La forma general de los problemas de la teora de control es
Maximizar

y establecer cierto control especificado T (t) e U. El perodo de tiempo (a, t \)


se llama el perodo de planificacin. En muchos problemas importantes, t \
-> + oo por lo que el horizonte de planificacin es infinito. Condiciones
varan de punto final. Normalmente la accin inicial de la variable de estado
es fijo, aunque la madre final puede no ser. Adems, puede haber
restricciones en las variables, tales como la no negatividad, agigantados
quiz desigualdad en el control. No vamos a cubrir estas situaciones ms
avanzadas.
Los problemas del tipo que acabamos de esbozar son fundamentalmente
diferentes de los encontrados en el anlisis de esttica comparativa
tradicional. En la denominada teora esttica, maximizando comportamiento

consiste en encontrar los valores de las variables independientes que


maximizan funciones con propiedades de curvatura especificados. Aunque
las direcciones de cambio de las variables de eleccin con respecto a los
cambios en las restricciones a veces se pueden derivar, las propiedades
empricas de los modelos estticos no incluyen la especificacin de los tipos
de tiempo de cambio de esas variables. En los modelos dinmicos, la
"solucin" se compone no slo de encontrar el valor mximo de una funcin,
sino ms bien de encontrar la funcin real que proporciona una trayectoria
temporal de valores de las variables econmicas de modo que algunos
funcin de valor, especifica ms de un intervalo de tiempo ,

se maximiza (o minimizada). Por esta razn, el integrando / in (20-2a) se


refiere a menudo como una funcional, siendo una funcin de funciones x (t)
y u {t).
Breve Historia *
El problema matemtico de encontrar una funcin que minimiza o maximiza
algn integrante primera fue planteada por Johann Bernoulli en 1696.
Bernoulli ret a sus col-ligas (y en particular a su hermano mayor de Jacob,
a quien se burl pblicamente como un incompetente) para encontrar la
forma de una alambre de friccin de tal manera que un cordn deslizante
hacia abajo se movera entre dos puntos (no alineados verticalmente) en el
menor tiempo. Mathe-maticians inmediatamente se dieron cuenta de la
diferente naturaleza del problema y se dedic a su solucin. La solucin de
Bernoulli era especfico para este problema y proporciona poco en el camino
de generalidad. (La forma en cuestin es un "cicloide," invertida la
trayectoria generada por un punto en el borde de una moneda, ya que se
rod en un avin). La primera solucin sistemtica fue derivado a principios
del siglo XVIII por Euler y Lagrange, que proporcion la ecuacin diferencial
general de que hay que resolver para este tipo de problemas. Este resultado
se discutir en breve. En su forma original, esta matemtica se llama el
clculo de variaciones.
En la dcada de 1950, la teora se generaliz por LS Pontryagin y sus
colleagues en la Unin Sovitica y por Richard Bellman y otros en los
Estados Unidos. El trabajo de Pontryagin fue motivada por problemas en las
ciencias fsicas; Orientacin de Bellman era general en la direccin de la
economa y la gestin de la ciencia. El clculo clsico de variaciones puede
considerarse un caso especial de theory control; Sin embargo, las tcnicas
ms antiguas son todava ms simple para algunos problemas, aunque por
lo general son ms difciles de interpretar en trminos de la teora
econmica.
20.2 SOLUCIN AL PROBLEMA

Vamos a explotar el razonamiento detrs de principio de Bellman de


optimalidad para desarrollar una solucin heurstica al problema de control.
El "truco" conceptual es dividir todo el perodo de tiempo en tan slo dos
perodos: el "presente", que dura slo un instante (o algn breve tiempo),
de algunos ta t + At, A> 0; y el "futuro", que consiste en el resto del perodo
de planificacin, desde t + A para t \. Vamos a interpretar el problema de
control en trminos de maximizar el valor presente de los peces en un lago,
como se describi anteriormente. El integrando en (20-2), f (x (t), u (t), t),
representa los beneficios netos instantneas de la pesca en la tasa de u (t).
Cuando se toma una decisin de peces de la cosecha, lo que produce un
flujo de beneficios netos en este momento, en el presente, en la cantidad de
f At. En este corto perodo de tiempo, la accin cambia poco. Si los peces en
el lago eran propiedad comn, un pesquero individuo maximizar beneficios
a corto plazo mediante el establecimiento de df / du = 0, como

tal como p = MC.) En estas circunstancias, los pescadores no tendran


ningn incentivo para incorporar los efectos de sus acciones presentes en el
futuro, por ejemplo, sobre el stock de peces disponibles y el efecto
concomitante en el costo marginal de la pesca. Sin la propiedad de las
acciones futuras de los peces, no hay ningn beneficio personal de restringir
actuales beneficios para lograr lo que podra ser, en principio, an mayores
ganancias futuras, ya que estos beneficios futuros probables sern
capturados por otra persona.
A medida que avanza la pesca, sin embargo, la poblacin de peces y, por lo
tanto, el valor de la propiedad de las acciones comienzan a cambiar. En un
mercado competitivo, asumiendo los peces en este lago forman slo una
parte insignificante de todo el mercado, el valor de las acciones en el lago
en cualquier momento sera (p - MC) x (f), suponiendo que por conveniencia,
constante costo marginal de la pesca a travs del tiempo. Incluso sin hacer
referencia a un mercado, sin embargo, hay un valor imputado de la
poblacin, dada por el producto de la accin, x, multiplicado por el valor
marginal neto de pescado. El valor marginal neto de pescado es el aumento
en el valor de la accin si, de alguna manera, un pez adicional se colocaron
en el lago. Este incremento en la actualidad la poblacin podra haber
complicado implicaciones a largo plazo para la poblacin futura, segn lo
determinado por el tipo de funcin de crecimiento y cosecha biolgica.
Vamos a ignoramos por el momento exactamente cmo se resuelve el
problema de control (20-2), pero suponemos que una solucin interior finita
(u * (t), x * (t)) s existe. Los valores (u * (t), x * (t)) representan las
"ptimas" trayectoria en el tiempo de las variables de control (tasa de
cosecha, en este ejemplo) y la variable de estado (el stock de peces).
Aunque estamos suprimiendo en la notacin, x * y U *, de hecho, depende

de los parmetros x0, t0, etc. denotan el valor resultante del objetivo
funcional como V (x0, a), es decir,

La funcin V (x0, t0) es directamente anloga a las funciones objetivo


indirectos de esttica comparativa; se llama la funcin valor ptimo. Aunque
(20-2) nos obliga a encontrar un camino real, o funcin, que maximiza una
integral, esa funcin, una vez encontrado, se traduce en una cierta funcin
valor mximo normal de los parmetros del modelo (suprimimos t \ no afn a
la discusion). El valor marginal de un incremento en el capital inicial de
pescado es simplemente 3 V (x0, a) / DxO. Ms en general, Vx (x (t), t)
representa el valor marginal del recurso en el tiempo t si JC variable de
estado se incrementa de forma exgena en el tiempo t, y la ruta ptima de
valores (x (t), u (t) ) se lleva adelante desde ese momento hasta el final del
perodo de planificacin.
Dada xQ, existe un valor marginal de la accin para cualquier tiempo t entre
el momento inicial y el tiempo de la terminal t \. Denotamos este valor k
imputada (t) = Vx (x * (t), t). El valor marginal del capital, X (t), se refiere a
menudo como la variable coestado o adjunto. El cambio en el valor de las
existencias de peces causada por la pesca es d [k (t) x (t)] / dt = kx '+ xk'.
El verdadero beneficio neto de la pesca en algn tipo de u (t) es la suma de
los beneficios en el presente, f (x, u, t), y el cambio en el valor mximo de la
accin causada por tomar esa accin en el presente . El ptimo (riqueza
maximizacin, por ejemplo) ruta se obtiene siempre el establecimiento de la
verdad (presentar futuro ms) beneficios netos marginales igual a cero a lo
largo de toda la trayectoria ptima de los valores (u * (t), x * (t)). Por lo
tanto, puede

caracterizar la solucin al problema de control de que exige, en cada t, t0 <t


<t \,
maximizar u, x

Utilizando la ecuacin de estado. (20-2 y), esto se convierte


maximizar u,

Suprimimos la dependencia de t en este momento porque todava no hemos


encontrado las funciones (u * (t), x * (t)) y les expresa como funciones de t.
Diferenciando con respecto al control u y los rendimientos de estado
variable x

La ecuacin (20-4) se llama el principio del mximo; (20-5) se denomina


coestado o adjunto ecuacin. Estas dos condiciones, adems de la ecuacin
de estado

son las condiciones necesarias para una trayectoria ptima (u * (t), x * (t))
de variables de control y estatales durante el perodo de planificacin.
Tambin determina es el camino de los valores marginales de la poblacin,
X (t).
Estas ecuaciones, sin embargo, no son simples ecuaciones en x, u, y X, en
cuyo caso se aplicaran tcnicas esttica algebraicas o comparativos
ordinarios. La ecuacin adjunto. (20-5) y la ecuacin de estado son
ecuaciones diferenciales; que son, en general, difcil de resolver.
Las ecuaciones (20-4) y (20-5) se expresan generalmente en trminos de la
expresin H = f + Xg, llamada hamiltoniano. El principio de mxima es de 3
H / du = 0 (suponiendo una solucin interior al problema); la ecuacin
adjunto es dH / dx = -A /. En el problema original, dado el valor inicial de la
accin, x0, la eleccin de u (t) determina x '(t) y por lo tanto x (t), a travs
de la ecuacin de estado. Por lo tanto, en realidad slo hay una "variable de
independent," u. Sin embargo, la introduccin de la nueva variable X (t)
aade otro grado de libertad; como en el anlisis de Lagrange esttica, que
"fingir" que el problema tiene una dimensin ms de lo que en realidad
tiene.
Usando el principio del mximo, Ec. (20-4), que no es una ecuacin
diferencial, e invocando el teorema de la funcin implcita, podemos
"resolver" para u: u = k (x, A, t). Sustituyendo esto en las ecuaciones
adjuntos y estatales produce dos ecuaciones de primer orden diferir-ciales

Resolviendo estas ecuaciones diferenciales (y usando las condiciones de


punto final relevantes para evaluar las constantes de integracin) produce
el camino ptimo de x y X. El uso de las soluciones a estas ecuaciones se
obtiene el camino ptimo de la variable de control, u, sustituyendo en k (x ,
k, t).
Un poco ms formal, considere cualquier punto (x0, a), no necesariamente
el punto inicial, a lo largo de la ruta ptima. El mximo (o mnimo, pero se
procede en el formato de maximizacin) valor de la integral objetivo es
alguna funcin V (x0, t0). A medida que avanzamos a lo largo de alguna
ruta especificada (x (t), w (0) por algn pequeo intervalo de tiempo A,
inmediatos "beneficios netos" de f (x, u, t) A se dio cuenta. En ese

momento, la funcin V depende de las nuevas coordenadas (JCO + Ax, t0 +


A) y el camino elegido entre a + A y t \, al final del perodo de planificacin.
Desde V (x0, a) es el valor del objetivo integral cuando el ruta ptima se
elige, para las opciones iniciales arbitrarias,
V (x0, t0)> f (x, u, t) A + Vix0 + Ax, t0 + Af) (20-9)
Aplicando el teorema del valor medio (o, alternativamente, un desarrollo en
serie de Taylor) para el ltimo trmino, tenemos, aproximadamente,
Vix0 + Ax, t0 + Af) = V (x0, t0) + Vx Ax + V, A
Sustituyendo esta expresin en el lado derecho de (20-9) y la cancelacin
de V (x0, a) desde ambos lados rendimientos
fijar, u, t) En Vx + Ax + Vt A <0
Dividiendo por A y teniendo lmites, y el uso de la ecuacin de estado dx / dt
= x '= g (x, u, t) los rendimientos
fijar, u, t) + Vxix, t) gix, u, t) + V, IX, t) <0 (20-10)
A lo largo del camino ptimo, (20-10) sostiene como una igualdad; en esa
forma, la ecuacin es conocida como la ecuacin de Hamilton-Jacobi:
fijar *, u *, t) + Vx (* \ t) gix *, u *, t) + vTIX *, r) = 0 (20-11)
Recordemos que A. (f) = Vx (x, f). Haciendo esta sustitucin en (20-10) los
rendimientos
fijar, u, t) + kit) gix, u, t) + vTIX, f) <0
Una vez ms, esta expresin tiene como una igualdad a lo largo del camino
ptimo (x * (f), w * (f)):
fijar *, u *, t) + X * es) gix *, u *, t) + vTIX *, 0 = 0 (20-12)
El ltimo trmino, Vt, la tasa de cambio de la funcional objetivo con respecto
al tiempo, es una funcin slo de x y t; es independ

iente de u. Por lo tanto, para x dado, el camino ptimo requiere


maximizacin de H - fijar, u, t) + kit) gix, u, t) con respecto a u lo largo de la
ruta ptima. Esta es la condicin mxima (20-4).
La ecuacin adjunto tambin es derivable de (20-11). Esta relacin es una
identidad en el tiempo y los parmetros del sistema, en particular x0,
cuando las trayectorias ptimas son

sustituido de nuevo en ella, como se indica. Diferenciando con respecto a x0


(supresin de la * 's),
fdx \ fdu \ \ fdx \ (du
fx (-) + fu [j ^) + Vx (xJ) \ gx (-) + gu [
V3x0 / V9 ^ o L \ dxoj \ dx {/
(* L) + VJ * L) = O
\ Dxoj tx \ dxoj
Recogida de trminos,
-) + [Fu + VAX, t) gu] (-) = 0 (20-13)
dxoJ \ dxoj
Sin embargo, el ltimo trmino entre corchetes es cero, por la condicin de
mximo (20-4), recuer-bering que k (t) = Vx (x, t). Tambin, la diferenciacin
de Vx (x, t) con respecto a /,
constituyendo los dos ltimos trminos en el primer conjunto de parntesis.
Suponiendo dx / DX 0 ^ = 0 (el capital social no es redundante abundante,
es decir, que tiene ms de ella afectara el nivel de las acciones ms
adelante), la Ec. (20-12) por lo tanto implica la ecuacin adjunto fx + KGX +
k '= 0. La ecuacin (20-12) da una interpretacin del hamiltoniano, que es la
suma de los dos primeros trminos. El ltimo trmino, Vt, indica en qu
medida el valor mximo de la integral objetivo va a cambiar despus de un
instante de tiempo ha pasado, la celebracin de la accin, x, constante. Por
lo tanto, el hamiltoniano es igual a la (negativo) efecto neto de iniciar el
proceso un poco ms tarde.
Ejemplo. Considere el problema ptima maximizar el control
- X au1 1 dt
sujeto a
X-U
x (0) = xQ
donde a> 0 es un parmetro para este problema. El hamiltoniano para este
problema es
H (x, u, A.) = -x + au2 Xu
Suponiendo una solucin interior, las condiciones necesarias

dH
= -AU + 1 = 0
du
D2H

Por supuesto a> 0, por lo D2H / du2 <0. Resolviendo dH / du = 0 para u da u


- X / a. Las otras condiciones necesarias son las ecuaciones de estado y
adjuntos
dH
x=
dX
dH
Utilizando u = A / a en estas ecuaciones rendimientos
x '- X / hacha (0) - x0 x (l) = X \),' = 1
Integracin X '= 1 da directamente X * (t) = t + C \, donde es un
desconocido C \ (hasta el momento) constante de integracin. Sustituto X *
(t) en x '= X / a togetx' = (t - \ - C \) / a. La integracin de esta ecuacin
rendimientos x * {t) = t2 / 2a + c {t / a ci +, donde c2 es otra constante de
integracin. Las constantes de integracin c {c2 y se determinan usando las
condiciones iniciales y terminales x (0) = x0 y x (L) = x \, respectivamente.
Usar x (0) = x0 en x * (t) para obtener x * (Q) = c2 = x0. Ahora usa x (L) =
JCI para obtener el valor de cx: x * {\) - l / 2a + C] / a + x0 = X \\ tanto, C \ a {{x - x0) - |. Estas constantes de integracin son luego sustituidos en {x *,
X *) para producir sus rutas ptimas, y entonces X * se sustituye en u = X /
a para dar trayectoria temporal ptima del control. Hacer esto le da
t2 \ 11
x (t; a, xo, x \) = h \ (x \ - XQ) - - \ t + x0
2a [2a J
k * (t; a, x0, XX) = t + a (xi - x0) - t1
u (t; a, x0, xi) = - + (xx - x0) - una 2a

Las condiciones de optimalidad (20-4) y (20-5) tambin pueden ser


entendidos en trminos de una formulacin de tiempo discreto del problema
de control ptimo:
maximizar
t=0
sujeto a
xt + i-xt = g (xt, t ut) t = 0, l, ..., T
En esta formulacin, el trmino xt + \ - xt sustituye el trmino x '{t) del
equation estado (20-2 y), y el signo de suma reemplaza la integral de la
funcin objetivo (20-2a). Las variables de eleccin de este problema son la
JCI, ..., xT (x0 y xT + i se dan) y u0, ..., UT. Colocacin de un multiplicador Xt
a cada uno de los T + 1 limitaciones produce la funcin lagrangiana
T

It is clear upon inspection that (20-14) is equivalent to the maximum


principle (20-4) of the continuous-time optimal control problem. Similarily,
(20-15) is the discrete form of the adjoint equation (20-5), with Xt Xt_\
taking the place of X'(t).
The Calculus of Variations
The original formulation of the problem of determining an optimal path is
to find some function x(t) that solves
maximize

T f(x,x',t)dt
JtQ

This is, in fact, a special case of the control problem, where x' = g(x, u,
t) = u. That is, the time rate of change of the stock is identically the
control variable, rather than some more general function that might also
include the stock itself and time. Substituting the state equation u = x'
into the integrand in (20-2a) yields this specification.
In this case, the necessary conditions for a maximum (or minimum)
are as follows. The maximum principle is
However, gx> = gu = 1, so this condition becomes
fx> = -k

(20-16)

The adjoint or costate equation is


H x = f x +Xg x = f x = -X'

(20-17)

since g x = 0. Since the right-hand side of (20-17) is the time derivative


of the right-hand side of (20-16), these equations can be combined into
d

df

Jx> = {-

(20-18)

dt

dx

Carrying out the differentiation in (20-18) results in the equivalent


expression
fx = f x't + fX'Xx' + f X'X'Xf

(20-18')

Equation (20-18) is the classic Euler-Lagrange relation defining the


necessary condition for an optimal path. Application of (20-18) (except for
special cases) results in a second-order differential equation, whereas the
necessary conditions of control

resultado teora en el diferencial de primer orden ecuaciones simultneas.


(20-7) y (20-8). No hay ninguna ventaja computacional uniforme a un
enfoque sobre el otro; Sin embargo, la ecuacin de Euler-Lagrange es difcil
de interpretar, y las ecuaciones de la teora de control a menudo ofrecen
caracterizaciones tiles de la dinmica de los modelos econmicos.
La solucin a la ecuacin de Euler-Lagrange puede ser oscura. En casos
especiales, sin embargo, algunos procedimientos pueden ser de
assistance.T En particular, si el objetivo funcional es una funcin de x y x
'solamente, es decir, sin incluir explcitamente t, la ecuacin de EulerLagrange es
_ DfAx, x ') _
Jx -, - Jx'xx r Jx'x'x
dt o
Jx Jx'xx ~~ Jx'x'X = 0
Como era de esperar, esta es una ecuacin diferencial de segundo orden.
Resulta, sin embargo, que x 'es un factor de integracin de esta expresin:
Multiplicando a travs de x' rendimientos
x '(fx - fx, xx' - fx, x, x ") = ^^^ = 0 Por lo tanto, en este caso la ecuacin
de Euler-Lagrange implica
f-x'fx, = k
donde k es la constante de integracin. Esta ecuacin puede (pero no
siempre) ser ms fcil de resolver que la condicin de Euler-Lagrange en su
forma original.

Ejemplo. Probemos algebraicamente resultado todo el mundo sabe


intuitivamente: La distancia ms corta entre dos puntos en un plano es una
lnea recta. Los dos puntos sern designados (t0, x0) y (esmoquin \).
Recordando el teorema de Pitgoras, a partir de un cierto punto y haciendo
pequeos movimientos dt en la direccin T y dx en la direccin x, la
distancia recorrida es la longitud de la hipotenusa:
ds = [(dt) 2 + {dxfV2 = [1 + x '(t) 2] l / 2 dt Buscamos minimizar la suma de
estos pequeos segmentos, o
minimizar
/ [L + x '(t) 2] l / 2dt Jt0
Este es un caso especial: El integrando depende slo de x '. La aplicacin de
la ecuacin de Euler en la forma (20-18 '),
fx, x, x "= 0
Por lo tanto, ya sea x "= 0 o fx, x, = 0. Aqu / = [1 + x '(t) 2] l / 2, por lo
tanto, fx, x, + 0. Por lo tanto, x" - 0. Este sencillo ecuacin diferencial tiene
la solucin x = C \ t + c2, confirmando la

resultado. Utilizando las coordenadas de los puntos finales para evaluar las
constantes de los rendimientos de integracin
- Xp) (Xpti -Xjtp)
_
(H Para obtener una mejor comprensin de la condicin de Euler-Lagrange,
considere la versin de tiempo discreto del clculo de variaciones problema:
maximizar
T
T / \ ^ / v Vv Y t \
v - / J J \ - * ~ tl A + l -Si, yo) t = 0
En esta formulacin de tiempo discreto, el argumento x 'en la funcin f (x,
x', t) se replaced por el argumento xt + \ - xt, y la integracin se sustituye
por suma. Las variables de eleccin de este problema son x \, ..., xT (x0 y xT
+ \ se dan), y las condiciones de primer orden para la maximizacin
necesarios son simplemente las condiciones habituales de primer orden

- -0
DXT
El xt variable aparece en la funcin objetivo slo en los trminos f (XT \, xt XT \, t - 1) y f (xt, xt + i -xt, t) para perodos t - 1 y t. Por tanto, la condicin
de primer orden para xt es
f2 (-xt-xt UXT - \, t - l) + fi (xt, xt + i -xt, t) - f2 (xt, xt + i - xt, t) = 0
donde f \ y f2 denotan las derivadas parciales respectivas con respecto a los
primero y segundo argumentos. Esta ecuacin se puede arreglar en
f2 (xt, xl +] -xt, t) - f2 (x, -i, xt -xt-i, t - 1) = fdxt, xt + l -xt, t) (20-19)
El lado izquierdo de esta ecuacin es el cambio en el valor de f2 desde el
perodo t - \ para el perodo t; es el anlogo de tiempo discreto de {d / dt)
fx>. El lado derecho de esta ecuacin es simplemente df / dx. La ecuacin
(20-19) es slo Eq. (20-18) en tiempo discreto.
Endpoint (transversalidad) Condiciones
Hasta este punto, hemos sido impreciso en cuanto a los efectos de
supuestos relativos a los valores inicial y final de la ruta ptima. Condiciones
de punto final generalmente no son un problema en el anlisis de esttica
comparativa, ya que se supone que las soluciones que se produzca en los
puntos interiores. En el anlisis dinmico, la ruta puede depender
fundamentalmente de la assumption realizados en relacin con los valores
iniciales y finales. La solucin a los problemas de control ptimo consiste en
resolver una ecuacin diferencial de segundo orden (o, ecuaciones de
primer orden equivalente, dos simul-tnea). En cualquier caso, aparecen dos
constantes arbitrarias de la integracin. Para estos parmetros a ser
evaluados, los supuestos adicionales se deben hacer sobre las rutas
ptimas.
Considere el problema de la pesca. Si el modelo se indica como un problema
de maximizacin entre t0 y finito de tiempo t \, el modelo esencialmente
asume que "no hay tiempo

after t\\ that is, in essence, the world comes to an end at t\. (A slightly
more general class of models appends a salvage value S[x(t\), t \ ] to the
maximization problem.) If, somehow, the stock of fish is simply specified
in terms of some initial and final values x(t 0 ) = x 0 and x(t {) = x\, there is
no further issue; these values will be used to evaluate the arbitrary
constants that appear in the solution to the differential equation defining
the optimal path. If, however, a positive stock of fish were to exist at t\
(the end of the world), it surely could have no value. Therefore,
necessarily, if x(t\) > 0, X(t\) =0. (With positive salvage values, X(t\) =
dS/dxi.) In many cases, however, the final value of the stock of fish is
not specified a priori; it is to be determined by the maximization
hypothesis. The same reasoning would then suggest that, since additional

stock would have zero value in terms of the objective function/, if x(ti) is
taken to be "free" (i.e., not specified in advance), then X(t\) = 0. Such
conditions are known as transversality conditions; they are the additional
conditions needed in order to evaluate the constants of integration in
optimal control problems. For maximization problems, if Jt(*i) > 0 is the
constraint on the terminal stock, the transversality conditions can be
stated as
Kh) > 0

x(ti) > 0

HhUih) = 0

(20-20)

In addition, in some problems, the final time itself, t\, is taken as free. In this
case the activity, say, fishing, would cease when prolonging it would have no
value, i.e., would add nothing to the value V(x,t) of the objective integral.
From the Hamilton-Jacobi equation (20-12), at /i
-Vt = fix*, u*, t) + k*it)gix*, u*, 0 = 0

(20-21)

if t\ is free. These conditions must be modified for more complex models,


e.g., those involving inequality constraints and salvage values; the
modifications in general resemble the Kuhn-Tucker restrictions in static
maximization^
Autonomous Problems
In the general control problem framework, the variable t can enter the
objective function and the state equation directly. The general
specification
maximize
fix,u,t)dt
to

subject to
x' = gix, u, t)

xit 0)

donde t entra / yg directamente, significa que los asuntos de la fecha. Es


decir, el costo o los ingresos generados por la actividad u (t) depende no
slo del nivel de extraccin y de stock de un recurso, o utilizacin del capital
(es decir, en el nivel de las variables de control y estado), sino tambin en
exactamente cuando esta actividad se lleva a cabo. En muchos (la mayora,
tal vez) los modelos econmicos, sin embargo, como la dependencia de la
fecha se incorpora slo en el trmino e ~ ta, que se utiliza para descontar el
ingreso futuro al presente, a.
Modelos en el que t es ausente de las ecuaciones objetivas y estatales, es
decir,

maximizar
\ F (x, u) dt
sujeto a
x '= g (x, u) x (a) = xo (20-22)
se llaman autnoma. En este caso, la condicin de mxima Hu = fu + XGU
= 0, la ecuacin de estado x '= g {x, u), y la ecuacin adjunto fx + xgx + X'
= 0 resultado en las ecuaciones diferenciales en x 'y X' que no impliquen t
explcitamente. Estas ecuaciones son mucho ms fciles de resolver que
aquellos en los que t aparece de forma explcita. Por razones prcticas, as,
por lo tanto, esta modificacin es importante.
Modelos en los que el tiempo entra explcitamente slo como parte del
factor de descuento e ~ rt se conoce generalmente como autnomo, as
como la dependencia del tiempo se elimina fcilmente. Es decir, tener en
cuenta los modelos de la forma
maximizar
1 f (x, u) e ~ IDTE
'A
sujeto a
x '= g (x, u) x (a) = xo (20-23)
Al reemplazar el tiempo t con la variable s = e ~ ta y la definicin de los
tiempos iniciales y finales en trminos de s, el problema de inmediato se
convierte en autnomo.
En los modelos de la forma (20-23), la variable coestado X (t) es el valor
presente (es decir, en el momento de) del valor marginal de un aumento del
capital en el momento /. A veces es ms conveniente para resolver estos
problemas utilizando un "multiplicador de corriente de valor", m (t), donde
e-r'm (t) = X (t) (20-24)
Las condiciones necesarias para la optimalidad son, de nuevo,
Hu = e'rtfu + XGU = 0 (20-25)
y
Hx = e ~ RTFX + xgx = -X '(20-26)

Uso de (20-24), sin embargo,


e-rtm \ t) -re-rtm {t) = \ '{t) Si ahora escribimos el hamiltoniano en forma
del valor actual como
<% = Erth = f + ertXg = / + mg de primer orden condiciones son
equivalentes a
^ U = fu + MGU = 0 (20-27)
y
Wx = fx + mgx = RM-m \ t) (20-28)
despus de cancelar e ~ ta de cada trmino. Las ecuaciones (20-27) y (2028) son ecuaciones diferenciales autnomas; es decir, la variable
independiente t no entra explcitamente como un argumento separado. El
sistema es generalmente ms fcil de resolver en esta forma.
Condiciones suficientes
La ecuacin de Euler-Lagrange, o la variante de la teora de control, las
ecuaciones. (20-4) y (20-5), adems de la ecuacin de estado (20-6) y
condiciones de transversalidad son de primer orden condiciones necesarias
para ya sea un mximo o mnimo. Condiciones suficientes anlogos a los de
la teora esttica son los siguientes:
Si / (JC, u, t) y g (x, u, t) son ambos inx todas partes cncava y u para todo t,
\ libras g (x, u, t) es no lineal en x o u, si X (t )> 0, y si las condiciones
necesarias de primer orden son satisfechos, la solucin representa un
mximo.
Asimismo, si f (x, u, t) y g (x, u, t) son a la vez en todas partes convexa,
entonces la solucin representa un mnimo.
En estas condiciones, el hamiltoniano ser cncava (o convexa, para los
problemas de mnimos). Dado que la expresin
H + X'X = f {x, u, t) + Xgix, u, t) + X'X
se maximiza (minimizada) en cada punto a lo largo de la trayectoria ptima,
estas condiciones son intuitivamente plausible. Tenga en cuenta que si gix,
u, t) es lineal en x y u, entonces concavidad de esta expresin ser
independiente de g y, por lo tanto, el signo de X (t). Para el clculo clsico
de los problemas de variaciones, es decir,
maximizar
['F {x, x', t) dt
la condicin suficiente es que el Fix integrando, x ', t) sea cncava en x y x'
para todo t. Para problemas mnimos, F debe ser convexa en xy x 'para todo

t. Esta condicin se puede aplicar en problemas de control de si la variable


de control puede ser eliminado a travs de

sustitucin, convirtiendo el problema a uno en el clculo de variaciones. Es


important tener en cuenta que la condicin suficiente anterior requiere
concavidad global (o convexidad) de / y g (o F); por lo tanto, la solucin (si
existe) a las condiciones necessary de primer orden se obtiene el ptimo
global. Una condicin ms dbil, Fx> x> <0 a lo largo del camino ptimo (>
0 para los problemas de mnimos), que se conoce como la condicin
Legendre, y es una propiedad de curvatura local. Es necesariamente est
implcito en la maximizacin (ntese la desigualdad dbil). Al igual que en
los problemas de optimizacin esttica, estas condiciones se often la base
de esttica comparativa o dinmica comparativos resultados en problemas
dinmicos.
20.3 SOLUCIONES a las ecuaciones diferenciales
Mediante el uso de tcnicas anlogas a la esttica comparativa, los efectos
de los cambios en los parmetros de la ruta ptima o en valores de estado
estacionario a veces estn disponibles. Sin embargo, con el fin de ser ms
manejable y til, muchos modelos incorporate simplificar supuestos.
Muchos de los problemas de control de inters asumen formas funcionales
especficas en las ecuaciones objetivas y estatales. Las ecuaciones mximos
y adjuntos a continuacin, dan lugar a ecuaciones diferenciales especficas
cuya solucin es de inters. Para ello, se investiga brevemente la naturaleza
de estas soluciones.
En general, las ecuaciones diferenciales son difciles de resolver, y algunas
ecuaciones de aspecto inocente, de hecho, intratable. Ciertos
procedimientos estndar son tiles; revisamos brevemente aqu ^ Algunas
ecuaciones diferenciales pueden ser resueltos por la separacin de las
variables:. Para resolver y '= dy / dt = y / t, escribimos
dy dt
y~t
La integracin de ambos lados rendimientos
ingrese 3; = Log t + log k
donde la constante arbitraria de integracin se denota log k para mayor
comodidad. Por lo tanto, la solucin general se puede escribir
y (t) = kt

Si se especifica que la curva debe pasar a travs de algn punto en


particular (? 0, yo), la constante de integracin se puede evaluar. Las
ecuaciones diferenciales que se pueden resolver de esta manera son los
ms fciles de trabajar.
Consideremos ahora la clase de ecuaciones diferenciales lineales de primer
orden
y '(t) + b (t) y (t) = c (t)

Esta ecuacin se llama lineal porque no hay trminos de la forma (y ') 2, yy',
etc. Por una solucin a esta ecuacin, nos referimos a una funcin y = s (t)
tal que cuando esta funcin se sustituye en este ecuacin, una identidad
resulta. El teorema fundamental identificar la naturaleza de estas soluciones
es como sigue. Considere la ecuacin. (20-29) sin la mano derecha:
+ b (t) y y '(t) = O (20-30)
Esto se llama la ecuacin reducida. (Cuando no hay una funcin del lado de
la mano derecha, una ecuacin diferencial se llama homognea.) Esta
ecuacin es generalmente mucho ms fcil de resolver que (20-29),
suponiendo que existe una solucin. Las soluciones a las ecuaciones
diferenciales, por supuesto, implicar constantes arbitrarias. Sin embargo, si
cualquier solucin particular se puede encontrar por (20-29), la solucin
general de (20-29) es la suma de esa solucin particular, adems de la
solucin general de la ecuacin reducida. (20-30).
Primero vamos a investigar estas ecuaciones cuando byc son constantes, en
lugar de ser funciones de t. La ecuacin (20-29) se llama entonces una
ecuacin diferencial de primer orden con coeficientes constantes. En ese
caso, la solucin a la ecuacin. (20-30) siempre se puede encontrar
multiplicando a travs de EBT. Tenga en cuenta que
bt ,,, h, d (ebty (t))
em (y + by) = = 0
dt
Por lo tanto, la solucin general de la ecuacin reducida es ehty (t) = K,
donde K es una constante arbitraria, o
y (t) = Ke ~ bt

Por inspeccin, a. solucin particular de (20-29) es y = c / b (tenga en


cuenta que y '= 0). Por tanto, la solucin general de (20 a 29) es
y (t) = Ke ~ bt + CSustituyendo esta expresin en (20-30) confirma que s es una solucin.
Ejemplo. Considere la ecuacin diferencial
y+y=t+i
Una solucin particular de la ecuacin no reducido es Y - t \ la solucin
general, ya que b = 1, por lo tanto, es
y = Ke ~ '+ t
En el caso ms general donde b = bits) y c = c (t), la bsqueda de una
solucin particular puede no ser fcil. Sin embargo, por Procediendo de una
manera similar al caso de coeficientes constantes, la solucin general de la
ecuacin reducida es siempre de la forma
Adicin de una solucin particular de (20-29) para esto produce la solucin
general.

Los mismos procedimientos se aplican a segundo orden ecuaciones


diferenciales lineales; cmo-nunca, el lgebra es ms compleja. Soluciones
generales de
y "+ by '+ cy = d (20-31)
consistir en la suma de una solucin particular de la ecuacin completa ms
la solucin general de la ecuacin reducida (homogneo)
y "+ by '+ cy = 0 (20-32)
Para resolver (20-32), que "tratamos" una solucin de la forma y = erx.
Sustituyendo esto en (20-32) los rendimientos
Esta ecuacin estar satisfecho de soluciones a la ecuacin de segundo
grado, llamada la ecuacin caracterstica,
r2 + br + c = 0 El uso de la frmula cuadrtica, las races son
-b (B2 ^ (20-33)
Hay varios casos para explorar.
1. Si b2 - Ac> 0, las races son reales y distintas; en ese caso la solucin de
(20-32)
es

y (t) = cierit + c2er2t (20-34)


donde C \ y c2 son las constantes arbitrarias de integracin. Tenga en
cuenta que si las dos races son negativas, y (t) - 0 como oo t -.
Problemas de la teora de control con este tipo de solucin convergen
asintticamente hacia un "estado estable"; si una o ambas races son
positivas y la constante (s) adjunto no son cero, el camino ser divergen.
2. Si b2 - Ac = 0, las races son idnticos: {r = r2 = r; la solucin a (20-32)
es entonces
y {t) = (cx + c2t) ert (20-35)
3. lib2 - Ac <0, las races son imaginarias, es decir, que implican i = * / - lLa solucin
es de nuevo de la forma (20-34) ya que las races son distintas; Sin
embargo, (20-34) no es un
expresin conveniente. Por esta razn, hacemos uso de la identidad
conocida
elt = costo + i sen?
Las partes real e imaginaria de las races de la ecuacin caracterstica se
definen, respectivamente, por p = -b / 2, q = (b2 - 4c) 1/2/2. La solucin a
(20-32) es entonces
y (t) = ept (cos ci (qt) + c2 sen (qt)

onde, de nuevo, cx y c2 son constantes arbitrarias. Tenga en cuenta que si


la parte real de las races p es negativo, la solucin y (t) oscilar en torno a
cero, que converge a cero como
t - oo.
Ecuaciones diferenciales simultneas
Los resultados formato teora de control en ecuaciones diferenciales
simultneas-tpicamente, uno para la variable x de estado (T) y uno para la
variable coestado, X. (t). Estos son generalmente de orden menor que la
nica ecuacin diferencial resultante de la ecuacin de Euler-Lagrange del
clculo de variaciones. Los dos, sin embargo, son equivalentes.
Consideramos que slo el caso lineal de primer orden:
x '= axx (t) + bxy (t) + f (t) y' = a2x (t) + b2y (t) + g (t)

Como en el caso de las ecuaciones diferenciales individuales, soluciones de


(20-37) consisten en la suma de una solucin particular al sistema completo
y la solucin general para el sistema reducida (homogneo)
x '= axx (t) + bxy (t)
(20-38) f = a2x (t) + b2y (t)
Consideramos que solamente la solucin del sistema homogneo, (20-38).
Diferenciar la primera ecuacin respecto de ty sustituyendo x 'e y' en (2038) se obtiene la ecuacin diferencial de segundo orden equivalente:
x "- (ax + b2) x '+ (aib2 - bxa2) x = 0 (20 a 39)
Esto se puede resolver utilizando los mtodos discutidos anteriormente. Sin
embargo, podemos proceder directamente con (20-38) e intntelo de
soluciones de la forma x (t) = Aert, y (t) = Bert. Sustituyendo en (20-38) y la
cancelacin de ert de cada trmino se obtiene la ecuacin de la matriz
i-r bx
a2 b2-r) \ Bj V0, Esta ecuacin tiene una solucin no trivial slo si su
determinante es cero:
'R *' = 0 (20-40)
a2 b2 - r
La expansin (20-40) se obtiene la ecuacin caracterstica
r2 - (ax + b2) r + (axb2 - bxa2) - 0 (20-41)
Es evidente que esta es la ecuacin caracterstica asociada con la de
segundo orden equivalente Eq. (20-39). As pues, la solucin sigue como
antes. Dejando rx y r2 ser las races (soluciones) de (20-41), si, por ejemplo,
r \ ^ r2, las soluciones a la diferencial simultnea homognea Ecs. (20-38)
son
x (t) = Axerit + A2er2t
y (t) = Ber ^ + Ver

Para los problemas autnomas horizonte infinito, es decir, donde el lmite


superior en el objetivo funcional es infinito, y el tiempo t entra directamente
slo en el factor de descuento, en todo caso, a menudo es motivo de
preocupacin si la solucin para el problema de control converge a algunos
ruta de estado estacionario (por lo general implica la solucin a la parte no
homognea de (20-37)). Si las races son negativos, o si las partes reales de
las races complejas son negativos, este resultado se asegur desde ert -> 0

cuando t -> oo en esos casos. Si una raz es negativo y el otro positivo, se


dice que el sistema tenga un punto de silla. Si, por ejemplo, r \> 0, la
solucin converger al estado estacionario si A \ y B \ = 0.
20.4 INTERPRETACIONES Y SOLUCIONES
Eleccin intertemporal
Consideremos primero el anlogo continuo del modelo de eleccin
intertemporal investigado en el Cap. 12. Supongamos que un consumidor
tiene una funcin de utilidad U (C (t)), donde C (t) es un flujo de consumo.
Suponemos U '> 0 y U "<0, como en la teora esttica. El individuo est
dotado de una reserva inicial del capital Ko. El ingreso del individuo es el
flujo iK obtuvo de la capital, donde i es la tasa de inters de mercado.
Adems, el individuo puede, mediante la venta de capital (que normalizar su
precio a la unidad), consumir el stock de capital y en cualquier momento.
Por ltimo, se supone que el consumidor est "impaciente", es decir, l o
ella tiene una tasa de tiempo de preferencia p. El modelo de maximizacin
de la utilidad intertemporal puede entonces expresarse como
maximizar
U (C) e ~ ptdt
o sujeto a
K '= Ik-C K (0) = K0 K (T)> 0
La variable de estado es el capital social; el control es el flujo de consumo, C
(t), el consumidor elige. La ecuacin de estado (restriccin) dice que el
cambio en el capital social ("ahorros" cuando es positiva y "desahorro"
cuando es negativo) es igual a la diferencia entre los ingresos obtenidos por
la accin, los conocimientos indgenas, y el consumo, C. Suponemos, por
supuesto , que C {t)> 0 y K (t)> 0 para todo t. El hamiltoniano es
H = U (C) e-pt + X (Ik -C) que produce las ecuaciones mximo y adjuntos
Hc = T \ C) e ~ pt -1 = 0 (20 a 43)
HK = ik = -k '(20-44)
Tenga en cuenta que el integrando es cncava en C, debido a la suposicin
de disminucin de la utilidad marginal ((/ "<0); la restriccin es lineal en C y
K. Por lo tanto, el hamiltoniano es cncava

donde, de nuevo, cx y c2 son constantes arbitrarias. Tenga en cuenta que si


la parte real de las races p es negativo, la solucin y (t) oscilar en torno a
cero, que converge a cero como
t - oo.
Ecuaciones diferenciales simultneas
Los resultados formato teora de control en ecuaciones diferenciales
simultneas-tpicamente, uno para la variable x de estado (T) y uno para la
variable coestado, X. (t). Estos son generalmente de orden menor que la
nica ecuacin diferencial resultante de la ecuacin de Euler-Lagrange del
clculo de variaciones. Los dos, sin embargo, son equivalentes.
Consideramos que slo el caso lineal de primer orden:
x '= axx (t) + bxy (t) + f (t) y' = a2x (t) + b2y (t) + g (t)
Como en el caso de las ecuaciones diferenciales individuales, soluciones de
(20-37) consisten en la suma de una solucin particular al sistema completo
y la solucin general para el sistema reducida (homogneo)
x '= axx (t) + bxy (t)
(20-38) f = a2x (t) + b2y (t)
Consideramos que solamente la solucin del sistema homogneo, (20-38).
Diferenciar la primera ecuacin respecto de ty sustituyendo x 'e y' en (2038) se obtiene la ecuacin diferencial de segundo orden equivalente:
x "- (ax + b2) x '+ (aib2 - bxa2) x = 0 (20 a 39)
Esto se puede resolver utilizando los mtodos discutidos anteriormente. Sin
embargo, podemos proceder directamente con (20-38) e intntelo de
soluciones de la forma x (t) = Aert, y (t) = Bert. Sustituyendo en (20-38) y la
cancelacin de ert de cada trmino se obtiene la ecuacin de la matriz
i-r bx
a2 b2-r) \ Bj V0, Esta ecuacin tiene una solucin no trivial slo si su
determinante es cero:
'R *' = 0 (20-40)
a2 b2 - r
La expansin (20-40) se obtiene la ecuacin caracterstica
r2 - (ax + b2) r + (axb2 - bxa2) - 0 (20-41)

Es evidente que esta es la ecuacin caracterstica asociada con la de


segundo orden equivalente Eq. (20-39). As pues, la solucin sigue como
antes. Dejando rx y r2 ser las races (soluciones) de (20-41), si, por ejemplo,
r \ ^ r2, las soluciones a la diferencial simultnea homognea Ecs. (20-38)
son
x (t) = Axerit + A2er2t
y (t) = Ber ^ + Ber "(2 " 42)

ASIGNACIN DE RECURSOS EN EL TIEMPO: CONTROL PTIMO TEORA 637


Para los problemas autnomas horizonte infinito, es decir, donde el lmite
superior en el objetivo funcional es infinito, y el tiempo t entra directamente
slo en el factor de descuento, en todo caso, a menudo es motivo de
preocupacin si la solucin para el problema de control converge a algunos
ruta de estado estacionario (por lo general implica la solucin a la parte no
homognea de (20-37)). Si las races son negativos, o si las partes reales de
las races complejas son negativos, este resultado se asegur desde ert -> 0
cuando t -> oo en esos casos. Si una raz es negativo y el otro positivo, se
dice que el sistema tenga un punto de silla. Si, por ejemplo, r \> 0, la
solucin converger al estado estacionario si A \ y B \ = 0.
20.4 INTERPRETACIONES Y SOLUCIONES
Eleccin intertemporal
Consideremos primero el anlogo continuo del modelo de eleccin
intertemporal investigado en el Cap. 12. Supongamos que un consumidor
tiene una funcin de utilidad U (C (t)), donde C (t) es un flujo de consumo.
Suponemos U '> 0 y U "<0, como en la teora esttica. El individuo est
dotado de una reserva inicial del capital Ko. El ingreso del individuo es el
flujo iK obtuvo de la capital, donde i es la tasa de inters de mercado.
Adems, el individuo puede, mediante la venta de capital (que normalizar su
precio a la unidad), consumir el stock de capital y en cualquier momento.
Por ltimo, se supone que el consumidor est "impaciente", es decir, l o
ella tiene una tasa de tiempo de preferencia p. El modelo de maximizacin
de la utilidad intertemporal puede entonces expresarse como
maximizar
U (C) e ~ ptdt
o sujeto a
K '= Ik-C K (0) = K0 K (T)> 0
La variable de estado es el capital social; el control es el flujo de consumo, C
(t), el consumidor elige. La ecuacin de estado (restriccin) dice que el

cambio en el capital social ("ahorros" cuando es positiva y "desahorro"


cuando es negativo) es igual a la diferencia entre los ingresos obtenidos por
la accin, los conocimientos indgenas, y el consumo, C. Suponemos, por
supuesto , que C {t)> 0 y K (t)> 0 para todo t. El hamiltoniano es
H = U (C) e-pt + X (Ik -C) que produce las ecuaciones mximo y adjuntos
Hc = T \ C) e ~ pt -1 = 0 (20 a 43)
HK = ik = -k '(20-44)
Tenga en cuenta que el integrando es cncava en C, debido a la suposicin
de disminucin de la utilidad marginal ((/ "<0); la restriccin es lineal en C y
K. Por lo tanto, el hamiltoniano es cncava

638 LA ESTRUCTURA DE LA ECONOMA


en C y K, asegurndonos que las soluciones a las ecuaciones de primer
orden representan valores mximos.
La ecuacin (20-43) dice que en cada punto de la trayectoria ptima de
consumo, la utilidad marginal descontado del consumo es igual al valor
presente (es decir, el valor en el tiempo t - 0) de una unidad adicional del
capital. Diferenciando (20-43) con respecto a t rendimientos
U "(C) C'e-pt - Pu '(C) e-pt = X'
A partir de (20-44), X '= = -ik -iu' (C) e ~ pt, utilizando (20-43). El uso de
este en el lado derecho de los rendimientos ecuacin anterior, despus de
cancelar el e ~ trminos pt,
-U "C
= I ~ p (20-45)
U'
El lado izquierdo de (20-45) es el cambio proporcional, con respecto al
tiempo, en la utilidad marginal del individuo de consumo. Esto representa
los beneficios marginales de aumentar el consumo en cualquier punto en el
tiempo. Por tanto, esta ecuacin dice que a lo largo de la trayectoria ptima
de consumo, estos beneficios marginales son iguales al costo de
oportunidad marginal de aumentar el consumo, la tasa de inters "neto", es
decir, el mercado (real) di menos la tasa de impaciencia.
Nota ahora las implicaciones de (20-45) para el comportamiento observable.
Desde U '> 0 y U "<0, C' (r) tiene el mismo signo que / - p.Thus, si / = p, es
decir, si la tasa de inters igual a la tasa de impaciencia, entonces, como en
los modelos estticos, el consumidor elige el consumo constante. Del mismo
modo, si el costo de oportunidad de mercado de consumo es superior a la

tasa del individuo de la impaciencia, el consumo aumenta con el tiempo, y


viceversa. Si la tasa de inters debe subir en algn momento t, el
consumidor va a acelerar el flujo de consumo, cambiando as el consumo de
la presente a una tasa mayor Ntese tambin que (20-44) es un simple
ecuacin diferencial lineal homognea;. su solucin es
X (t) = koe'11 (20-46)
donde A.o> 0 es la constante de integracin. El valor actual del valor
marginal del capital por lo tanto disminuye con el tiempo; su valor actual,
ELTK {t) se mantiene constante en Ao Combinando esta ecuacin con (2043) los rendimientos
U '{C {t)) = Xoe {p-l) t (20-47)
Consideremos ahora lo que debe suceder al final del perodo de
planificacin. Recordemos que la condicin de transversalidad (20-20), que
es una consecuencia de la restriccin de no negatividad en el capital social
de terminal, requiere que X (T) K (T) = 0. De cualquier capital debe ser
agotado, K (T) = 0 , o su valor marginal debe caer a cero en la fecha final.
La nica razn de capital no sera utilizado por completo es si el consumo
adicional que proporcion no tena ningn valor, es decir, si el consumidor
ya se haba saciado para que ms ingresos ya no se prefiere menos en ese
margen. Si, como se ha supuesto, U '(C)> 0 para cualquier nivel de
consumo, debe ser el caso de que en t = T, K (T) = 0. Por lo tanto, en el
supuesto ms siempre es preferible al menos, el capital agotados al final del
perodo de planificacin.

ASIGNACIN DE RECURSOS EN EL TIEMPO: CONTROL PTIMO TEORA 639


Las ecuaciones (20-45) a (20-47) caracterizan la solucin a este modelo.
Con el fin de obtener trayectorias reales de consumo y la utilizacin de
capital, tendramos que asumir una forma funcional especfica para la
funcin de utilidad. Para ilustrar la solucin para controlar modelos,
supongamos que U (C) = log C. En ese caso, (20-45) se convierte

\\ DC
)
C
Separando las variables e integrando,
C (t) =

(20-48)

La ecuacin (20-48) es el camino de la variable de control C (t). Para derivar


la trayectoria de la variable de estado K, recordar la ecuacin de estado (la
restriccin):
K '- iK = -C = -Coe {i-p) t
Esto se puede integrar con el factor de integracin e ~ lt:
d {e- [TK)
-Pt
= -Coe
dt
e-l \ K '-ik) = Integrando ambos lados rendimientos

e-'K (t) = I ^

La

(20-49)

donde A es la constante arbitraria de integracin. En t = 0, K (0) = Ko; Por lo


tanto,
Del mismo modo, usando K (T) = 0,
oAy por lo tanto,

A=

-Koe ~ PT

pK0

La solucin a (20-49) es por lo tanto


K {t) = KQelt

-pt - 0-

640 LA ESTRUCTURA DE LA ECONOMA


K'

FIGURA 20-1
La funcin K '= g (K) muestra la tasa de cambio de la poblacin de peces
(capital social) cuando no hay cosecha se lleva a cabo. Para K <KMSY, el
stock de pez crece; cuando K> KMSY, K encoge. A solas, algunas
rendimiento mximo sostenido (valor mximo de K ') se produce en KMSY.
Sin embargo, esta tasa harvest no es en general eficaz.

La recoleccin de un recurso renovable


Un problema estrechamente relacionado con el anterior se ha aplicado al
problema de la recoleccin algn recurso renovable, tales como peces. ^
Asumimos la misma funcin objetivo, excepto que para este ejemplo,
tomamos el horizonte de tiempo a ser infinito. Ms importante an,
suponemos que, dejado solo, el stock de peces creceran a una tasa hasta
cierto tamao mximo; y, si la accin fuera de alguna manera ms grande,
el pescado sera el saldo neto mueren, la reduccin de las existencias a su
tamao en estado estacionario. Formulamos el modelo como
maximizar

sujeto a

/ OO

/ T {C) e ~ ptdt Jo
K '= g (K) - C K (0) = Ko

(20-50)

donde K representa el balance de los recursos renovables (en este caso, el


pescado). La funcin g (K) representa el crecimiento biolgico de las
acciones; que se representa en la Fig. 20-1. Con stock cero (K = 0), no hay
ninguna reproduccin, y ^ permanece en cero. Al quedarse solo, para K
positivos, la accin crecera a una tasa determinada por K '= g {K). Para
muchas especies en entornos dado, un "rendimiento mximo sostenible"
KMSY existe, donde g '(K) = O.We asumir que g' (K)> Ofor / ST <KMSY y g
'(K) <Ofor ^ T> KMSY; por lo tanto, g "{K) <0. Por lo tanto, si KMSY eran el
stock actual de los peces, sera posible consumir K '= g {KMSY) para
siempre. Suena plausible que esto es un nivel eficiente (que maximiza la
utilidad) del consumo. Sin embargo, la consideracin de la dinmica
^ Vase, por ejemplo, CG Plourde, "Un modelo simple de reponible
Explotacin de Recursos Naturales," American Economic Review, 60: 520522, junio 1970.

ASIGNACIN DE RECURSOS EN EL TIEMPO: CONTROL PTIMO TEORA 641


aspectos del modelo, en particular, las posibilidades de preferencia en el
tiempo y el efecto del tamao de la poblacin de peces en el costo marginal
de la pesca, cambia esa opinin. El hamiltoniano actual valor de (20-50) es
'K = U (C) + m (g (K) - C) (20-51)
Las ecuaciones mximos y adjuntos estn
We = U '(C) ~ m = 0 (20-52)
y
WK = mg '(K) = pm-m! (20-53)
Tenga en cuenta que los supuestos anteriores relativas a las formas de U (C)
y g (K), y el hecho de que el valor marginal actual de la poblacin es
positiva, garantizan la concavity del hamiltoniano en C y K; por lo tanto,
las soluciones a las ecuaciones de primer orden son caminos que maximizan
la integral objetiva. Al igual que en el modelo anterior, la ecuacin mxima
(20-52) dice que a lo largo del camino ptimo, el valor imputado marginal
actual de las reservas de capital, en este caso de pez es igual a la utilidad
marginal del consumo de pescado. La ecuacin (20-53) se puede reescribir

g \ K) = p - (20-54)
m
El trmino g '{K) especifica la velocidad de crecimiento de la poblacin de
peces; es el beneficio de la espera, o retrasar el consumo de un incremento
de tiempo. En un modelo no dinmico, la riqueza o la utilidad de
maximizacin exigira este beneficio marginal para igualar el costo de
oportunidad del capital, que en este caso viene dado por la tasa del
consumo de impaciencia, p. Sin embargo, las decisiones en el presente
afectan el futuro; el consumo de pescado afecta la tasa de porcentaje de
cambio del valor marginal de pescado. Este coste adicional, la prdida de
capital, -m '/ m, hay que aadir al coste directo de la espera. (Por supuesto,
-m '/ m podra ser negativo, compensando as la tasa de impaciencia.)
Sin funciones especficas para U (C) y g (K), es posible una solucin analtica
del modelo. Sin embargo, para los modelos autnomos tales como stos, un
dispositivo analtico conocido como un diagrama de fase puede ser utilizado
para caracterizar la solucin y para derivar los resultados de esttica
comparativa.
Desde la condicin mxima (20-52), U '(C) = m. Desde U "<0, esta es una
funcin montona, sino que puede ser invertida, usando una versin global
del teorema de la funcin implcita, obtenindose C = c (m) El uso de este
en la ecuacin de estado (la restriccin) da dos ecuaciones diferenciales
determinantes. el movimiento del modelo:
K '= g (K) - c {m) K (0) = Ko (20-55)
m! = Pm- mg \ K) (20-56)
Una constante, o estacionario, el estado se produce cuando los valores de
las variables se mantienen constantes en el tiempo. Por tanto, estos valores
se determinan mediante el establecimiento de k '= m' = 0 en el

642 LA ESTRUCTURA DE LA ECONOMA

K '= 0
K * K,
FIGURA 20-2
Fase diagrama que muestra el punto de estabilidad de una silla. El ptimo
(que maximiza la utilidad) tasa de explotacin se produce en K *, donde g
'(K) = p> 0, es decir, a la izquierda de KMSY. El estado estacionario se

produce en la interseccin de la K '= 0 y m' = 0 loci. Por encima de K '- 0, K


aumenta con el tiempo; por debajo de ella, K disminuye. Del mismo modo, a
la izquierda de m '= 0, el valor actual de la poblacin, m, disminuye; a la
derecha, m aumenta. En puntos como A y C, los caminos divergen desde el
estado estacionario; en puntos tales como B y D, que convergen para el
estado estacionario.

ecuaciones anterior, resultando en

g (K) - c (m) = 0 p-gf (K) = 0

(20-57) (20-58)

Estas dos ecuaciones se representan en la Fig. 20-2. Denotan los valores de


estado estacionario de K y m como K * y * m. Considere el locus donde K '=
0, la ecuacin. (20-57), primero. Desde U \ C)> 0 y U "{C) <0, c '{m) = \ / U"
<0. Por supuesto, g (K) primero se eleva y luego, despus de KMSY, cae. Por
lo tanto, c (m) debe subir y luego bajar para mantener la igualdad en (2057). Desde c '(m) <0, como K aumenta desde el origen, m s debe caer y
luego subir, alcanzando su valor mnimo donde g (K) es grande, por lo KMSY.
Por lo tanto, el lugar geomtrico de (K, m) donde K '= 0 es la curva en forma
de U representado. Por otro lado, para m '= 0, la ecuacin. (20-58) es
simplemente una lnea vertical, en K = K *. Pero tenga en cuenta que, dado
que g '{K) = 0 en K = KMSY yg \ K *) = p> 0, K * es a la izquierda de KMSY.
Con preferencia temporal positiva, el consumo en estado estacionario se
desplaza hacia el presente. Por otra parte, ya que la tasa de preferencia
temporal (o la tasa de inters de mercado, en un modelo equivalente)
aumenta, la cada del capital de estado estacionario de valores y m (t), ya
que, a la izquierda de KMSY, g '(K)> 0wdg " (K) <0.
No hemos demostrado, sin embargo, que para algunos Ko arbitraria, la
trayectoria ptima en realidad tender hacia el estado estacionario.
Considere cmo los valores de K y m cambiarn en las cuatro reas del
plano de fase entre las curvas K '= 0 y m! = 0. En todos los puntos por
encima de la locus en forma de U definida por K '= 0, K'> 0; debajo de l, K
'<0. De la misma manera, a la izquierda de la lnea vertical de m' = 0, m
'<0; a la derecha de esta lnea, m> 0. Por lo tanto, si K ym toman valores
distintos (K *, m *), que se trasladar en las direcciones indicadas por las
seales de K 'y m'. Estas direcciones se indican por las flechas en la Fig. 202. En los puntos A y C, la ruta se aleja del estado estacionario. De puntos
tales como B y D, el camino converge hacia (K *, m *). Este punto

estacionario es, pues, un punto de silla. La ecuacin caracterstica


determinar la solucin

ASIGNACIN DE RECURSOS EN EL TIEMPO: CONTROL PTIMO TEORA 643


al problema de control contiene una positiva y una raz negativa. Se obtiene
la solucin ptima cuando la constante de integracin unido a la raz
positiva se fija igual a cero.
Es importante sealar que este procedimiento slo es vlido porque el
sistema es autnomo. Si el tiempo entr en la ecuacin. (20-55) o (20-56)
directamente, es decir, si la fecha importaba, a continuacin, simplemente
sabiendo K y m no sera suficiente para determinar el movimiento de las
variables. La fecha, es decir, si el valor de t, tambin tendra que ser
especificado.
Que el estado de equilibrio es el camino ptimo es a menudo una
afirmacin. A veces puede justificarse apelando a las propiedades de
curvatura de las funciones en el modelo. En este caso, por ejemplo, si
suponemos que como C -> 0, U '(C) -> oo, y que como C - oo, U' (C) -
0, entonces caminos que convergen a cero el consumo, por ejemplo, no
podra ser ptimo; el valor marginal de un aumento del consumo en los
pequeos valores de C exceder el costo marginal total de la cosecha. Del
mismo modo, las rutas que divergieron hasta el infinito no podra ser ptimo
con costos marginales positivos de la pesca.
Una justificacin alternativa para el inters en una solucin de estado
estacionario es que el comportamiento estable en lugar de explosivo parece
ser empricamente ms relevante. El mundo no parece proporcionar
ejemplos de divergencia de la capital hasta el infinito, y la extincin de los
recursos es poco frecuente, con derechos de propiedad bien definidos.
Un modelo conexo de la extraccin de recursos renovables formula el
objetivo funcional en trminos de maximizacin de la riqueza, como ya
presentado en este captulo:
maximizar
poo
[Pu - c (K, u)] e ~ IDTE
'O sujetos a
K '= g (K) - u K (0) = Ko (20-59)
En este modelo, los peces se cosechan y se venden a razn de u (t) en
algn precios constantes p; la funcin de costo depende de la accin, as
como la tasa de extraccin. (Tenga en cuenta que el smbolo c denota

"costo" en esta formulacin, no "consumo", como en el modelo anterior.) El


hamiltoniano actual-valor es
% E = c pu- (K, T) + m (g (K) - u)
Asumimos la funcin de costo es estrictamente convexa en K y U, y
mantenemos el supuesto estafador cavidad relativa g (K). Por lo tanto, el
propio hamiltoniano es estrictamente cncava, y las condiciones necesarias
de primer orden son suficientes para un mximo. Las ecuaciones mximos y
adjuntos estn
ytu = p-cu-m = 0 (20-52 ')
y
WK = -CK + mg '(K) = rm-mr (20-53')
La ecuacin (20-52 ') es equivalente a (20-52) en el sentido de la definicin
de las condiciones ordinarias de la maximizacin; aqu el valor actual
marginal de la poblacin, m, es igual a

644 LA ESTRUCTURA DE LA ECONOMA


los beneficios corrientes netas de pescado de extraccin, el precio menos el
costo marginal. En los modelos estticos, esta condicin sera simplemente
el precio es igual al costo marginal; en modelos dinmicos, el costo de
oportunidad de los acontecimientos futuros se capitalizan en las decisiones
presentes. Reorganizar (20-530, tenemos
g \ K) = r - - + ^ (20-54 ')
mm
Esta ecuacin es similar a (20-54), excepto que un cK / term m adicional
est presente. Recordemos que en el anlisis anterior, el estado de
equilibrio, deriva mediante el establecimiento de m '= K' = 0, se produjo
donde g '(K) = r (o la tasa de impaciencia, p). Desde r (op) se supone
positivo, K * <KMSY. Sin embargo, en la Ec. (20-54 '), tenemos el extra cK
plazo / m, el signo de que es una cuestin emprica. (Nosotros, por
supuesto, asumir m> 0; el capital social no tiene valor marginal negativo.)
Este trmino indica el efecto sobre el costo de la pesca de un aumento en el
stock de peces. Es fcil imaginar (y empricamente probable) que un mayor
stock de pescado reduce los costos marginales y el total de la pesca de
cualquier nivel de actividad. En ese caso cK <0, y es posible que K * que se
produzca donde g '(K) <0, lo que implica K *> KMSY. Es posible que el
retraso de la cosecha ya la espera de la accin para construir puede
producir una ganancia suficientemente grande en el futuro para compensar
el costo de oportunidad de los fondos mediante la reduccin del costo de la
cosecha.

Utilizacin de Capital
Consideremos ahora un modelo de utilizacin del capital con una funcin
objetivo algo ms general. Imagine un acervo de capital x (t) en el tiempo t
que permite a una empresa (o persona, tal vez este es el capital humano)
para ganar una corriente de rentas R (x). Subsumido en esta funcin, por
simplicidad, es un comportamiento en el que la persona o empresa combina
algunos otros insumos (por ejemplo, mano de obra) con el capital social de
alguna manera presumiblemente costo-minimizacin. Supongamos que el
capital se deprecia (o "evapora") a una tasa de bx lineal y que el costo de la
inversin en nuevo capital est dado por c (w). La empresa desea utilizar y
adquirir capital a fin de maximizar la riqueza en un horizonte infinito. El
modelo es
maximizar
poo
/ [R (x (t)) - c (u (t))] e-rt dt Jo
sujeto a
x '(t) = (0 - bx (t) x (0) = xQ> 0 (20-60)
Suponemos existe una solucin interior, con u (t)> 0, y que x (t)> 0 en
todas partes. La ecuacin de estado x '- u - bx define, como siempre, la
dinmica del modelo; se dice que la tasa de cambio en el stock de capital es
igual a la tasa de adquisicin de nuevo capital menos la evaporacin en el
tiempo t. La variable de control es la velocidad de adquisicin de capital, es
decir, la tasa de inversin. La funcin objetivo es una vez ms autnoma (en
el sentido de que el tiempo entra slo en la funcin de descuento), y las
variables de estado y de control estn separadas funcionalmente. Estos
supuestos simplificadores, aunque limitando en trminos

ASIGNACIN DE RECURSOS EN EL TIEMPO: CONTROL PTIMO TEORA 645


de su aplicacin terica, proporcionar incrementos sustanciales de
trazabilidad. Supondremos que R (x) es cncava y c (u) es convexa [y, por lo
tanto, - c {u) es cncava] para que un mximo est asegurado si las
condiciones necesarias de primer orden estn satisfechos. Tenga en cuenta
que la ecuacin de estado es lineal, por lo que no tiene ningn efecto sobre
las condiciones suficientes. El hamiltoniano actual-valor es
3f = R (x) - c (u) + m (u - bx) la produccin de las ecuaciones mximos y
adjuntos
Wu = -c '{u) + m = 0 (20 a 61)
y

Wx = R '(x) = -BM RM-m (20-62)


junto con la ecuacin de estado
xf (t) = u (t) -BX (t) (20-63)
La ecuacin (20-61) dice, al igual que en los modelos anteriores, que el
valor marginal actual del capital social, m (t), es igual al valor actual de los
costos marginales de la inversin en capital nuevo, c '(u). La ecuacin
adjunto. (20-62) es ms fcil de interpretar por escrito como
R '{x) + m = (b + r) m
El lado derecho es el costo de oportunidad de los fondos, que consiste en la
tasa de depreciacin del valor del capital social x en t tiempo ms el
rendimiento de la inversin alternativa, r. A lo largo de una trayectoria que
maximiza la riqueza, este costo de oportunidad marginal debe ser igual al
tipo marginal en el que se estn produciendo beneficios. Estos beneficios
marginales se derivan de dos fuentes: Los beneficios instantneos
(marginales) de un incremento adicional del capital, R '(x), adems de la
ganancia de capital m' (t) (es decir, la tasa de cambio en el valor marginal
de la capital que ocurren en el tiempo t, que deriva de la riqueza futura
utilizacin de maximizacin del capital social). Como en todos los procesos
dinmicos (y esto es lo que los hace dinmico), el valor de las medidas
adoptadas en el presente tiene dos componentes: Algunos beneficios netos
inmediatos ms la suma de los beneficios netos futuros.
La ecuacin (20-62) se puede interpretar adems de esta manera por la
multiplicacin a travs de por e "^ b + r) t y la escritura como
e ~ {b) t r + [m - m {b + r)] = -e- (r + b) tR '(x)
La integracin de ambos lados y suponiendo R '(x) est delimitada desde
arriba de modo que la funcin integral evaluada en el lmite superior es
cero,
/ OO
(b + r) = tm / e- (r + b) R '(x (s)) ds electrnico
o, a travs de la multiplicacin por e ^ r + b) t,
POO
m (t) = / e- (r + b) (s- R '(x (s)) ds (20-64)

646 LA ESTRUCTURA DE LA ECONOMA


La ecuacin (20-64) dice que el valor actual (en el tiempo t) marginal del
capital es los futuros beneficios marginales netos descontados a la hora t,

donde la tasa de inters utilizada para descontar es la suma de la tasa de


inters real r y la depreciacin tasa b, lo que refleja el verdadero costo de
oportunidad de utilizar esta capital en particular. Por ltimo, la combinacin
de esta ecuacin con la ecuacin. (20-61) dice que los costos marginales
son iguales a estos beneficios marginales:
poo
c '{u {t)) = e' ^^ - ^ R'ixis ^ ds (20-65)
Jt
Vamos ahora a "resolver" este problema, en el sentido de investigar si existe
alguna solucin de estado estable y lo que sus propiedades son. Utilizamos
un anlisis esquemtica similar a la utilizada anteriormente e investigar
caminos en el (x, m) plano de fases que satisfagan las condiciones de
primer orden.
Desde costo marginal es estrictamente creciente (c "> 0), eliminamos la
variable de control u invirtiendo c '(u) = m, por lo que u = h (m), donde h'
(m) = \ / c"> 0. Sustituyendo esto en la ecuacin de estado da
x '= h (m) - bx (20-66)
La ecuacin (20-66) y la ecuacin adjunto (20-62)
R '(x) + m' = {b + r) m (20-62)
constituyen dos ecuaciones diferenciales en X y m. El estado de equilibrio se
produce donde x '= m' = 0:
l) = bx (20-67)
R '(x) = {b + r) m (20-68)
Estas ecuaciones se esbozan en la figura. 20-3. .. Desde c '(0) = 0 y c "> 0,
la ecuacin (20-67) pasa por el origen y tiene pendiente positiva La
interseccin de las dos curvas es el estado estacionario y se denota S; dej
x * y m * ser los valores de estado estacionario de x y m.
A continuacin preguntamos si existen caminos que son consistentes con
las ecuaciones de primer orden y que el enfoque S asintticamente. Desde h
(m) es creciente en m, en puntos por encima de la lnea, x '= h (m) -BX> 0;
Asimismo, x '<0 por debajo del umbral. Adems, dado que R "(x) <0, R '(x)
es decreciente en x; por lo tanto, la ecuacin (20-68) tiene pendiente
negativa en el plano de fase Por encima de esta curva, m..' - (B + r) m - R
'{x)> 0, por lo que m est aumentando por encima de la curva y la
disminucin de debajo de la curva.
El efecto combinado de estos movimientos se indica por las direcciones indicado por las flechas en la figura. 20-3. Caminos que convergen hacia el
estado estacionario existen comenzando ya sea a la "noroeste" (pero por

debajo de m '= 0) o a la "sureste" (pero por encima de m' - 0) de S. El otro


indic caminos son inestables, es decir, que divergen hasta el infinito o cero.
El estado estacionario es un punto de silla. Rechazamos los caminos
divergentes como empricamente unobserved o descartado por las
propiedades de curvatura de R (x) y c (u), por ejemplo, Rf (x) - oo cuando
x -> 0, etc.
Un procedimiento algebraico comn usado para confirmar las propiedades
del estado estacionario, cuando las ecuaciones que definen son no lineales
(como en este ejemplo), es linealmente

ASIGNACIN DE RECURSOS EN EL TIEMPO: teora de control ptimo

647

FIGURA 20-3
Fase diagrama que muestra el punto de estabilidad de una silla para el
Utilization Modelo de Capital. El estado estacionario 5 "se produce en la
interseccin de la x '= 0 y m' = 0 loci Por encima de x '= 0, x est
aumentando;..! Debajo de l, x est disminuyendo tambin, por encima de
m = 0, m es cada vez mayor ;... por debajo de ella, m est disminuyendo los
efectos combined se muestra por las flechas Algunas rutas a partir de la
"northwest" y "sureste" de S convergen para el estado estacionario Un
aumento en r sale del x '= 0 locus afectado, pero cambia el m '= 0 locus
hacia el origen. Por lo tanto, el aumento de la tasa de interest menor tanto
en el estado estacionario capital social x * y el valor marginal actual m *.

aproximar la x 'y M' ecuaciones diferenciales de todo el estado estacionario,


utilizando los trminos de primer orden de una serie de Taylor. Al realizar
esta operacin,
x '= -b (x - x *) + h \ m) (m - m *) m' = -R "(x *) {x - x *) + (r + b) (m - m *)
Las races caractersticas son [ver la Ec. (20-33)]
kuk2 = \ {r [(r + 2b) 2 - 4 h '(m *) R "(x *)] l / 2}
Desde h! > 0 y R "<0, las races son reales, y puesto que el trmino en el
radical es mayor que r, las races son de signo opuesto, con el absoluto de
la raz ms pequea negativo. Por lo tanto, el estado de equilibrio es un
punto de silla dentro de algn Barrio.

Se ha insistido en este libro que el objetivo de matemtica mod-Eling es


derivar hiptesis refutables, y que tales proposiciones generalmente toman
la forma de declaraciones acerca de las direcciones de las respuestas de las
variables de decisin a los cambios en las restricciones. En los modelos
dinmicos, tales cuestiones se pueden plantear, por ejemplo, sobre el efecto
en los valores de estado estacionario del capital social como diversos
parmetros cambian. Estos se denominan preguntas esttica comparativa,
como en esttico mod-els. Una investigacin ms difcil se refiere al efecto
de un cambio en un parmetro en todo el camino de o bien el control o la
variable de estado; estas preguntas se denominan dinmicas comparativas.
Se ilustra brevemente este anlisis utilizando el presente ejemplo.
Pues bien, de las ecuaciones. (20-67) y (20-68) que un aumento en la tasa
de inters deja la primera ecuacin (x '= 0) pero no afectados desplaza la
segunda im' = 0) locus hacia el origen. Como resultado, la capital del
estado de stock constante se baja, es decir, dx * / dr <0. De la pendiente
positiva de la x '= 0 locus, dm * / dr <0 tambin, y

648 LA ESTRUCTURA DE LA ECONOMA


de la condicin de mximo c '(u) = m, du * / dr <0. Esperamos que estos
resultados. Si el costo de oportunidad de los fondos para su uso en las
presentes aumentos, aplazando el consumo hacia el futuro (mediante la
inversin en nuevo capital) debera disminuir, lo que resulta en un menor
capital social definitiva. Un aumento en la tasa de depreciacin b produce
cambios algo ms ambiguas; b entra Ec. (20-68) (m '= 0) de la misma
manera como lo hace r, sino que tambin entra en la ecuacin. (20-67) (xr 0). Desde h '(m)> 0, un aumento en b desplaza la x' = 0 hasta locus. Como
resultado, x * debe caer claramente, pero el cambio de m * (y, por lo tanto,
u *) es ambigua.
Aunque en general los teoremas de esttica comparativa de este tipo son
difciles de estado, resultado est disponible para los efectos de los cambios
en la tasa de inters (o tasa de preferencia temporal) en el capital social de
estado estacionario, para los modelos "autnomos".
Teorema de Caputo. ^ Considere un modelo ptimo autnoma generales de
control con horizonte infinito,
maximizar
/ "OO
f (x, u, a) e-rldt
'A
sujeto a

X = g (jt, u) x (0) - XQ U U
donde U es el conjunto de control y un> 0 es un parmetro independiente
del tiempo. Supongamos que existe una solucin ptima que converge al
punto de silla estado estacionario del modelo. Sea (x * (a, r), u * (a, r))
denotan este estado de equilibrio, con la * 's en las funciones que se usan
para indicar que se evalan en los valores de estado estacionario.
1. La respuesta de x * (a, r) yu * (a, r) a un cambio en la tasa de inters, r,
viene dada por
sgn I - - j = sgn? (/; g;) (20-69a)
sgn - = -sgn (/; ^) (20-6%)
\ Dr J
2. Si el parmetro A entra en / de tal manera que se adjunta a x solamente,
es decir, FUA = 0, entonces el efecto del cambio en una est dada por
SM ^ T) = sn (/, ) (20-70a)
- ^) = -sgn (G>; /; a) (20-10b)
Michael R. Caputo, "La estructura cualitativa de una Clase de Infinite
Horizon ptimo Problemas de control," Aplicaciones de control ptimo y
Mtodos, 18: 195-215, 1997. Vase l corolario (a).

ASIGNACIN DE RECURSOS EN EL TIEMPO: CONTROL PTIMO TEORA 649


3. Si el parmetro A entra / tal que est unido a T solamente, es decir, fxa =
0, entonces el efecto del cambio en una est dada por
= Sgn (/ * (r ~ 8 *) 8 "} (20-71a)
r - ) ) (20-71 / 7)

Resultados 2 y 3 son "pares conjugados" teoremas, anlogos a los obtenidos


anteriormente en los modelos estticos. Se puede demostrar que g *
aparece en todos los estado estacionario resultados de esttica comparativa
para u * (a, r). Por lo tanto, si G * = 0 (o si gx = 0), es decir, si la ecuacin
de estado es independiente de la variable de estado en el estado
estacionario (o global), entonces el valor de estado estacionario de la
variable de control es independiente de una y la tasa de descuento r.
En el ejemplo anterior, fu = -c '(u) <0 y gu = 1; por lo tanto, dx * / dr <0, tal
como se deriva directamente. El teorema tiene una amplia aplicacin en los
modelos de extraccin de recursos. Los signos de estas parciales son a
menudo aparente. Por lo general, la funcin integrando f (x, u) mide algn

tipo de beneficios netos (o valores negativos de costos) que estn


aumentando en u, tan tpicamente fu> 0 y la ecuacin de estado tiene la
forma x '= h (x) - u para que gu <0 (ver, por ejemplo, los modelos de la
seccin sobre la cosecha de un recurso renovable). Por lo tanto, en esos
modelos, generalmente encontrar dx * / dr <0.
Dinmica comparativos se refiere a las respuestas de la totalidad de los
caminos de x (t), u (t) y k (t) [o m (t)] como los parmetros del modelo de
cambio. El procedimiento es similar al utilizado en la esttica comparativa
en que las "soluciones", x (t, r, b), m (t, rb) se sustituyen en las ecuaciones
diferenciales simultneas que definen los caminos de x y m [(20- 62) y (2066) en este modelo]. Estas ecuaciones simultneas son luego diferenciarse
segn algn parmetro, produciendo lo que se llama un sistema de
ecuaciones diferenciales variacional. A veces es posible determinar el
cambio en la ruta de acceso, basado en las propiedades de curvatura de las
funciones en el modelo. Con ms de una variable de estado, sin embargo, el
anlisis grfico de dos dimensiones es imposible. Dicho material est ms
all del alcance de este texto; las referencias al final del captulo contienen
las discusiones sobre este problema.
PROBLEMAS
1. Resolver el problema ptima maximizar el control
-u2 dt
'O sujetos a
x '= x + u JC (O) = 1 * (l) = 0 2. Resuelva el problema ptima maximizar el
control
YO
2
(X + tu - u2) dt

650 LA ESTRUCTURA DE LA ECONOMA


sujeto a
x '= u x (l) = 3 JC (2) = 4
3. Resolver el problema de control ptimo
maximizar
/ '("'" "T) *
sujeto a

x '= u-x x (0) = x0 x (l) = 0


4. En la seccin titulada "Utilizacin de Capital," vamos a R (x) = ax - x2 / 2
y c (u) = Cu2. Resolver
el modelo de manera explcita, y relacionar su solucin para el anlisis en el
captulo.
5. Considere una mina que contiene una cierta cantidad X de algn recurso
mineral. Sea x (0 representan
la cantidad acumulativa extrado en el tiempo t, de modo que u - x '(t) es la
tasa de extraccin. Suponer
la tasa actual de los beneficios de la mina est dada por P (u), donde P '> 0,
P "<0. Suponga
que el propietario de la mina maximiza la riqueza en el periodo [0, T] y que
no hay
valor residual despus de T. Suponga una tasa de inters de mercado fijo, r,

(A) Demostrar que el valor presente de los beneficios marginales es


constante en [0, T]. Explique.
(B) Demostrar que la disminucin de tasas de extraccin a travs del
tiempo.
(C) Supongamos que la tasa actual de los beneficios de la mina se da por
registro u. Encuentra el actual
camino de la extraccin de recursos, donde x (0) = 0, x (t) la riqueza de
maximizacin = X.
(D) Cmo es la explotacin del recurso afectado por cambios en la tasa de
inters, r?

6. Resolver el modelo de recurso renovable, (20-50), utilizando un diagrama


de fase en fase (K, C)
espacio. (Sugerencia: Diferenciar la condicin mxima con respecto al
tiempo, a continuacin, utilizar la
adjunto y ecuaciones mximos para eliminar m y m '').
7. Resolver el problema de control ptimo
maximizar
f2

/ (2x - 3u - au) dt
Jo sujeto a
X=X+U
* (0) = 5 x (2) CAPTULO libre 20
1. x * {t) = -e2k {-t) + k (t); k * (t) = 4e2k (-t); u * (t) = 2e2k (-t), donde k (t)
=
[E '/ (l-e2)].
2. x * (t) = t + 2; * u (t) - 1; k * (t) = -t + 2.
3. x * (t, a, XQ) = a (t - 1) + k (t) (a x0 +) - e2 (x0 + a) k (-t); k * (t, a, x0) =
2 (x0 + a) k (t);
* u (t, a, x0) = a + 2 (x0 + a) k (t), donde k (t) = [e '/ (l - e2)].
7. x * (t, a) = (e2 / 2a) e- '+ (l / 2a) + [(10a - e2 - l) / 2a] el; k * (t, a) = 2 (1 e2 "); * u (t, a) = (S2- '- l) / a