Vous êtes sur la page 1sur 6

Clase # 22 • No se dispone de datos

Toma de previos.
decisiones sin • Las circunstancias
experimentación varían constantemente.
• La decisión no se toma
en forma repetida
Toma de decisiones sin
experimentación. • Se dispone de datos
Toma de previos.
decisiones con • Las circunstancias no
experimentación varían constantemente.
• La decisión se toma en
forma repetida
Diseño: Andrés Gómez 22-1 Diseño: Andrés Gómez 22-2

Resumen del análisis de toma de decisiones.


En la toma de decisiones sin experimentación
existen varios criterios para elegir la acción óptima.
1. El tomador de decisiones necesita elegir una de
las acciones posibles.
2. La naturaleza elegirá entonces uno de los estados
de la naturaleza posibles.
3. Cada combinación de una acción a y un estado 1. Criterio del Pago Máximo (pesimista).
de la naturaleza θ da como resultado un pago 2. Criterio del optimista.
θ ).
p(a ,θ 3. Criterio de la máxima posibilidad.
4. La tabla de pagos debe usarse para encontrar 4. Criterio de minimización del arrepentimiento.
una acción óptima para el tomador de decisiones 5. Criterio de maximización del pago promedio
según un criterio adecuado. (Regla de decisión de Bayes)

Diseño: Andrés Gómez 22-3 Diseño: Andrés Gómez 22-4

Criterio del Pago máximo (pesimista o maximini) Ejemplo GOFERBROKE COMPANY .


Algoritmo
θ
1. Para cada acción se escoge el pago mínimo sobre Petróleo Seco Mínimo
a
todos los estados de la naturaleza y se lleva a una
lista. Perforar $700000 -$100000 -$100000
2. De esta lista se escoge el máximo valor. La acción
asociada con este valor es la acción a elegir. Vender $90000 $90000 $90000

Este razonamiento es bastante válido cuando se está Probabilidad 0.25 0.75


compitiendo contra un oponente racional y malévolo. Sin
embargo, este criterio es demasiado conservador pues Elegimos el pago mínimo sobre los estados de la
supone que la naturaleza es un oponente que le quiere naturaleza de las 2 acciones posibles y luego el
infligir al tomador de decisiones todo el daño que sea posible. máximo de estos. Sigue
Diseño: Andrés Gómez 22-5 Diseño: Andrés Gómez 22-6

1
Ejemplo PIZZERÍA COMINI.
Este es el menor
Pagos
mínimos pago posible que la θ No Arrendar Construir
petrolera podría a mudanza Apartamentos Apartamentos
a 1 :-100000 obtener, dado que la
naturaleza obrara No trasladarse 100 50 20
a 2 : 90000 malévolamente.
Cra 65 40 150 25

Calle Colombia -20 20 200


La compañía petrolera eligirá entonces vender los
terrenos, y se abstendrá de realizar la perforación. Probabilidad 1/3 1/3 1/3

El criterio del pesimista siempre garantiza un pago mínimo Elegimos el pago mínimo de las 3 acciones posibles
y luego el máximo de estos.
Sigue
Diseño: Andrés Gómez 22-7 Diseño: Andrés Gómez 22-8

Criterio del optimista.


Pagos mínimos
Este es el menor
Algoritmo
a 1 : 20 pago posible que la
pizzería podría
a 2 : 25 1. Para cada acción se escoge el mayor valor y se
obtener, dado que la
lleva a una lista.
naturaleza obrara
a 3 :-20 2. De esta lista se escoge el mayor valor. La acción
malévolamente.
asociada con este valor es la acción a elegir.

Este criterio es completamente opuesto al anterior, pues acá


La Pizzería eligirá entonces trasladase a la carrera supone que la naturaleza obrará completamente a favor del
tomador de decisiones y que la suerte estará siempre del lado
65 pues de esta manera obtendrá el mejor pago,
de este. En este criterio el tomador de decisiones lo arriesga
dado que ocurra lo peor. todo sin mirar lo malo que pueda ocurrir.

Diseño: Andrés Gómez 22-9 Diseño: Andrés Gómez 22-10

Ejemplo GOFERBROKE COMPANY .


Este es el mayor
Pagos
θ máximos pago posible que la
Petróleo Seco petrolera podría
a a 1 : 700000 obtener, dado que la
Perforar $700000 -$100000 naturaleza obrara
a 2 : 90000 benévolamente.
Vender $90000 $90000

Probabilidad 0.25 0.75

Sobre todos los estados de la naturaleza elegimos el La compañía petrolera eligirá entonces perforar los
pago máximo de las 2 acciones posibles y luego el terrenos que tienen a su disposición.
máximo de estos. Sigue
Diseño: Andrés Gómez 22-11 Diseño: Andrés Gómez 22-12

2
Ejemplo PIZZERÍA COMINI.
Pagos máximos Este es el mayor
θ a 1 : 100 pago posible que la
No Arrendar Construir
a mudanza Apartamentos Apartamentos
pizzería podría
a 2 : 150 obtener, dado que la
No trasladarse 100 50 20 naturaleza obrara
a 3 : 200
benévolamente.
Cra 65 40 150 25

Calle Colombia -20 20 200


Probabilidad 1/3 1/3 1/3 La Pizzería eligirá entonces trasladase a la Calle
Colombia pues de esta manera obtendrá el mejor
Elegimos el pago máximo de las 3 acciones posibles pago, dado que ocurrirá lo mejor.
y luego el máximo de estos.
Sigue
Diseño: Andrés Gómez 22-13 Diseño: Andrés Gómez 22-14

Criterio de la máxima posibilidad Ejemplo GOFERBROKE COMPANY .


Algoritmo
θ
1. De todos los estados de la naturaleza se elige el Petróleo Seco
a
estado que tenga mayor probabilidad de ocurrir.
2. Para este estado de la naturaleza se encuentra la Perforar $700000 -$100000
acción con el máximo pago y se elige.
Vender $90000 $90000
La mayor desventaja de este criterio es que ignora por Probabilidad 0.25 0.75
completo mucha información relevante. No se considera
ningún estado de la naturaleza distinto del más probable. En
un problema con muchos estados de la naturaleza, la Elegimos el estado de la naturaleza con mayor
probabilidad del más importante puede ser bastante probabilidad.
pequeña. Sigue
Diseño: Andrés Gómez 22-15 Diseño: Andrés Gómez 22-16

Ejemplo PIZZERÍA COMINI.


Pagos Este es el mayor
Estado seco pago posible que la θ No Arrendar Construir
petrolera podría a mudanza Apartamentos Apartamentos
a 1 :-100000 obtener para el
estado de la No trasladarse 100 50 20
a 2 : 90000 naturaleza con
mayor probabilidad. Cra 65 40 150 25

Calle Colombia -20 20 200

El estado de la naturaleza más probable es que no Probabilidad 1/3 1/3 1/3


exista petróleo en los terrenos. Por lo tanto la
compañía decidirá vender los terrenos. Elegimos el estado de la naturaleza con mayor
probabilidad.
Sigue
Diseño: Andrés Gómez 22-17 Diseño: Andrés Gómez 22-18

3
Modelo de minimización del
Pagos arrepentimiento (minimax)
Los 3 estados tienen
a 1 : 100 igual probabilidad Algoritmo
por lo que se elige el
a 2 : 150 mayor pago de cada 1. Para cada estado de la naturaleza:
estado y luego el a) Determinar el máximo pago.
a 3 : 200
mayor de estos b) Para cada acción obtener la pérdida de
oportunidad.
c) Construir una tabla de arrepentimientos
con estos valores.
La Pizzería eligirá entonces trasladase a la Calle
Colombia pues de esta manera obtendrá el mejor
pago. Los 3 estados son igual de probables, por lo 2. De la tabla de arrepentimientos tomar para cada
tanto lo mejor es elegir la acción que otorgue un acción al valor máximo y llevarlo a una lista.
mayor beneficio. 3. De esta lista escoger el mínimo valor
Diseño: Andrés Gómez 22-19 Diseño: Andrés Gómez 22-20

Ejemplo GOFERBROKE COMPANY .


Arrepentimiento: Pérdida o costo de oportunidad.
Es lo que se pierde por no haber tomado la mejor
decisión. θ
Petróleo Seco
a

Perforar $700000 -$100000


Pérdida de Pago de la
Pago máximo Vender $90000 $90000
oportunidad de acción para el
para el estado -
una acción para = estado de la
de la naturaleza Probabilidad 0.25 0.75
un estado de la naturaleza
naturaleza
Para cada estado de la naturaleza elegimos la
alternativa de mayor pago y construimos la tabla
de arrepentimiento Sigue
Diseño: Andrés Gómez 22-21 Diseño: Andrés Gómez 22-22

θ Este es el valor que


Petróleo Seco Arrepen-
a timiento minimiza el
arrepentimiento .
Perforar $700000 -$100000 a 1 :$190000
Vender $90000 $90000 a 2 :$610000

Tabla de
arrepentimiento
Petróleo Seco
Lo máximo de lo que puede arrepentirse la
Perforar $0 $190000 petrolera si elige la acción 1 es de perder $100000 y
dejar de ganar $90000.
Vender $610000 $0
Diseño: Andrés Gómez 22-23 Diseño: Andrés Gómez 22-24

4
Ejemplo PIZZERÍA COMINI. θ No Arrendar Construir
a mudanza Apartamentos Apartamentos
θ No Arrendar Construir No trasladarse 100 50 20
a mudanza Apartamentos Apartamentos
Cra 65 40 150 25
No trasladarse 100 50 20 Calle Colombia -20 20 200

Cra 65 40 150 25
Tabla de No Arrendar Construir
Calle Colombia -20 20 200 arrepentimiento mudanza Apartamentos Apartamentos
No trasladarse 0 100 180
Probabilidad 1/3 1/3 1/3
Para cada estado de la naturaleza elegimos la Cra 65 60 0 175
alternativa de mayor pago y construimos la tabla
de arrepentimiento
Calle Colombia 120 130 0
Sigue
Diseño: Andrés Gómez 22-25 Diseño: Andrés Gómez 22-26

Modelo de maximización del pago


Arrepen-
promedio (Regla de decisión de Bayes)
timiento Este es el valor que
a 1 : 180 minimiza el Algoritmo
arrepentimiento
a 2 : 175 1. Usando las probabilidades de cada estado de la
naturaleza se calcula el valor esperado del pago de
a 3 : 130
cada acción posible.
2. Se escoge el mayor valor esperado y la acción
asociada a el mayor valor es la elegida
La Pizzería eligirá entonces trasladase a la Calle
Colombia pues de esta manera obtendrá lo máximo La gran ventaja de este criterio es que incorpora toda la
de lo que puede arrepentirse es de ganar 20 cuando información disponible, incluyendo todos los pagos y las
pudo haber ganado 150 . mejores estimaciones disponibles de las probabilidades de los
respectivos estados de la naturaleza.
Diseño: Andrés Gómez 22-27 Diseño: Andrés Gómez 22-28

Ejemplo GOFERBROKE COMPANY .


θ )}= 0.25* $700000 + 0.75*(-$100000) = $100000
E {p(a 1 ,θ

θ θ )}= 0.25* $90000 + 0.75*($900000) = $90000


E {p(a 2 ,θ
Petróleo Seco
a

Perforar $700000 -$100000

Vender $90000 $90000

Probabilidad 0.25 0.75


La petrolera eligirá la acción 1 pues esta es la
Calculemos el valor esperado del pago de cada alternativa con el mayor valor esperado del pago
acción posible
Sigue
Diseño: Andrés Gómez 22-29 Diseño: Andrés Gómez 22-30

5
Ejemplo PIZZERÍA COMINI.
θ )}= 1/3*100 + 1/3*50 + 1/3*20 = 56.6
E {p(a 1 ,θ
θ No Arrendar Construir θ )}= 1/3*40 + 1/3*150 + 1/3*25 = 71.6
E {p(a 2 ,θ
a mudanza Apartamentos Apartamentos
θ )}= 1/3*(-20) + 1/3*20 + 1/3*200 = 66.6
E {p(a 3 ,θ
No trasladarse 100 50 20

Cra 65 40 150 25

Calle Colombia -20 20 200


Probabilidad 1/3 1/3 1/3 La pizzería eligirá la acción 2 pues esta es la
Calculemos el valor esperado del pago de cada alternativa con el mayor valor esperado del pago
acción posible
Sigue
Diseño: Andrés Gómez 22-31 Diseño: Andrés Gómez 22-32

Vous aimerez peut-être aussi