Académique Documents
Professionnel Documents
Culture Documents
, es
Estos costos se muestran en la figura 1.
La atencin se centrara en la pregunta: Cul es la ruta que minimiza el costo total
de la poliza?
Solucin del problema
Observe primero que el procedimiento poco inteligente de elegir la ruta ms
barata en cada etapa sucesiva no conduce a una decisin ptima global. En caso
de adoptar esta estrategia, se obtiene la ruta , con un costo total
de 13. Sin embargo, un pequeo sacrificio en una etapa puede permitir mayores
ahorros ms adelante. Por ejemplo, es, en total, ms barato que
.
Un enfoque posible para resolver es te problema es el de prueba y error. Sin
embargo, el nmero de rutas posibles es grande (18) y el clculo del costo total
de ca da ruta no es una tarea atractiva.
Por fortuna, la programacin dinmica proporciona una solucin con mucho
menos es fuerzo que la enumeracin exhaustiva. (El ahorro computacional es
enorme cuando se trata de versiones ms grandes de este problema.) La
programacin dinmica comienza con una pequea porcin del problema original
y encuentra la solucin ptima para es te problema pequeo. Despus agranda de
manera gradual el problema y encuentra la solucin ptima actual a partir de la
que le precede, hasta resolver el problema original completo.
En el ca so del problema de la diligencia, se comienza con el problema sencillo
que plan tea queel cazafortunas casi halle gado al final de su viaje y slo tiene
una etapa ms una jornada en la diligencia por recorrer. La solucin ptima
obvia de es te problema reducido es ir del estado actual el que sea en el que se
encuentre a su destino final (estado ). En cada una de las iteraciones
siguientes, el problema aumenta de una en una el nmero de etapas que le
quedan por recorrer para completar el viaje. En cada problema aumentado se
puede encontrar la solucin ptima del lugar al que debe dirigirse desde cada
estado posible, donde se toman en cuenta los resultados obtenidos en la iteracin
anterior. A continuacin se describen los de talles de es te procedimiento.
Formulacin:Sean
, donde
.
Sea
el valor de
y
sea
. Entonces,
donde
El valor de
al establecer (el
estado actual) y
El objetivo es encontrar
para encontrar
.
Procedimiento de solucin. Cuando el cazafortunas tiene solo una etapa por
recorrer ( ), su ruta de ah en adelante esta perfectamente determinada por su
estado actual (ya sea o), asi como su destino final,
de manera que la
ruta de esta ltima jornada en diligencia es . Por tanto,
,
la solucin inmediata al problema para es
n=4
3
4
Cuando el cazafortuna tiene solo una etapa por recorrer ( ), el procedimiento
de solucin requiere unos cuantos clculos. Por ejemplo, suponga que se
encuentra en el estado . Entonces, como se describe en el diagrama, debe ir al
estado , o al estado con unos costos inmediatos respectivos de
, o
.
Son necesarios los clculos similares cuando se parte de los otros dos estados
posibles , y con dos jornadas por delante. Intente obtener la respuesta
con la ayuda tanto de un diagrama (Figura1) como del algebra [combine valores
de
H I
E 4 8 4 H
F 9 7 7 I
G 6 7 6 H
La solucin de la segunda etapa ( .), cuando quedan tres jornadas por
recorrer, se obtiene en forma parecida. En este caso,
. Por
ejemplo, suponga que el cazafortunas se encuentra en el estado , como se
muestra en el siguiente diagrama.
Ahora deber ir al esta do E, F o G con costos inmediatos respectivos de
,
respectivamente, como muestra el nmero colocado arriba de los estados E, F y G
en el diagrama anterior. A continuacin encontrar un resumen con los clculos
que resultan de las tres alternativas.
El mnimo de estos tres nmeros es 7, por lo que el costo total mnimo desde el
estado C al final es
.
Al hacer clculos similares cuando se parte del estado B o D se llega a los
siguientes resultados para el problema de :
E F G
B 11 11 12 11 E o F
C 7 9 10 7 E
D 8
8
11 8 E o F
En el primer y tercer renglones de esta tabla observe que E y F empatan como el
valor que minimiza
.
Si se pasa al problema de la primera etapa ( ), con las cuatro etapas por
recorrer, los clculos son parecidos a los que se acaban de mostrar para la
segunda etapa ( ), excepto que ahora slo hay un inicio posible, , como
se muestra en el siguiente diagrama.
A continuacin se resumen los clculos sobre los tres destinos inmediatos
posibles:
Como el mnimo es 11,
B C D
A 13 11 11 11 C o D
Ahora es posible identificar una solucin ptima a partir de las cuatro tablas. Los
resulta dos del problema con indican que el cazafortunas debe elegir como
primer destino inmediato el estado C o el estado D. Suponga que elige
. Con
, el resultado de
es
con
, y el problema con indica que
En la figura 2 se resumen es tos resulta dos del anlisis de programacin
dinmica. Observe que las dos flechas de la etapa 1 se obtienen de la primera y
ltima columnas de la tabla de y el costo se encuentra en la penltima
columna. Cada una de las otras flechas (y el costo resultante) se lee en un rengln
de cada una de las otras tablas, exactamente de la misma manera.
2. Caractersticas de los problemas de programacin
dinmica
A continuacin se presentan y estudian las caractersticas bsicas que distinguen a los
problemas de programacin dinmica.
1) El problema se dividen en etapas, cada una de las cuales requieres de una
poltica decisin.
2) Cada etapa tiene cierto nmero de estados asociados a su inicio. En
general, los estados son las distintas condiciones posibles en las que se
puede encontrar el sistema en cada etapa del problema. El numero de
etapas puede ser finito o infinito.
3) El efecto de la poltica de decisin en cada etapa es transformar el estado
actual en un estado asociado con el inicio de la siguiente etapa, quiz
segn una distribucin de probabilidad.
4) El procedimiento de la solucin esta diseado para encontrar una poltica
optima para manejar completo, es decir, una receta para elaborar la poltica
de decisin optima para cada etapa en cada uno de los estados posibles.
5) Dado el estado actual, una poltica ptima para las etapas restantes es
independiente de la poltica adoptada en etapas anteriores. Por tanto, la
decisin inmediata ptima depende solo del estado actual y no de cmo se
llego ah. Este es el principio de optimalidad de la programacin dinmica.
6) El procedimiento de solucin comienza cuando se determina la poltica
ptima para la ltima etapa.
La poltica optima para la ltima etapa prescribe la poltica ptima de
decisin para cada estado posible en esa etapa. Es comn que la decisin
de este problema de una etapa sea trivial, como lo fue en el problema de la
diligencia.
7) Se dispone de una relacin recursiva que identifia la poltica optima para la
etapa , dada la poltica para la etapa .
En el problema de la diligencia se obtuvo :
]
Entonces, para encontrar la politia optima de decisin cuando se comienza
en el estado de la etapa se necesita encontrar el valor que minimice
.
El costo minimo correspondiente se obtiene al usar este valor de
para
que despus seguir la poltica optima cuando el proeo se encuentra en el
estado
en la etapa .
L a forma precisa de la relacion recursiva difiere de un problema a otro de
programacin dinmica, pero se usaa una notaion anloga y se resume de
la siguiente manera:
Nmero de etapas
Etiqueta de la etapa actual ( ).
Valor optimo de
(dado
en la etapa , la decisin
inmediata es
La relacin recursiva siempre tendr la forma
] o
],
Donde
se escribe en trminos de
y tal vez
alguna medida de la contribucin inmediata de
a la funcin objetivo. Lo
uq hace que la expresin de
esta
definida en trminos de
.
8) Cuando se usa esta relacin recursiva, el procedimiento de solucin comienza al
final y se mueve hacia atrs etapa por etapa para encontrar cada vez la poltica
ptima para esa etapa hasta que encuentra la poltica ptima desde la etapa
inicial. Esta poltica ptima lleva de inmediato a una solucin ptima para el
problema completo, es decir,
, despus
para el
estado
para el estado
que se obtiene, y as
sucesivamente hasta
para el esta do
resultante.
3. Programacin dinmica determinstica
4. Programacin dinmica probabilstica
5. Conclusiones