Vous êtes sur la page 1sur 16

Universidad Carlos III de Madrid

Curso 2001-2002

Apuntes de Teoría de la Decisión


El Modelo Basico de Decision1

Introducción
El objetivo de la ciencia económica es introducir elementos de racionalidad en las decisiones económi-
cas. La teoría de la decisión propone una metodología y las herramientas adecuadas para enfocar la
toma de decisiones en situaciones de incertidumbre. La teoría de la decisión es parte del instrumen-
tal básico de la Teoría Económica. Su metodología tiene numerosas aplicaciones a los problemas
de decisión individual más comunes (seguros, inversiones, etc.) y es de uso muy frecuente tanto en
Economía Aplicada (Economía Industrial, Economía Pública, Finanzas, etc.) como en Economía
de la Empresa (Economía de las Organizaciones, Recursos Humanos, etc.).

Decisión e incertidumbre
Tomar una decisión significa elegir una acción o una alternativa entre varias disponibles. Si la
consecuencia de cada acción o alternativa disponible es cierta y conocida de antemano, tomar una
decisión es un acto trivial. Por ejemplo, si en una misma calle un estanco oficial y un vendedor
ambulante venden los mismos paquetes de tabaco por 2.2 Euros y 2 Euros respectivamente, cualquier
fumador racional acude al vendedor ambulante y se ahorra 20 centavos por paquete. En este
caso, la consecuencia de cada decisión (comprar al estanque o comprar al vendedor ambulante)
viene determinada por el precio del objeto. Si, por el contrario, la consecuencia de las acciones o
alternativas disponibles son inciertas, tomar una decisión es un problema complejo. Por ejemplo,
si un forofo del esquí solo puede librarse de su trabajo un fin de semana al año para dedicarse a
su deporte preferido, fijar de antemano con su jefe el fin de semana festivo para ir a esquiar es
una decisión azarosa ya que el éxito de este único fin de semana (¡y de la temporada!) depende de
condiciones meteorológicas inciertas y poco previsibles en montaña.
Este curso trata de las decisiones en presencia de incertidumbre. Incertidumbre significa que las
consecuencias de cada acción o alternativa disponible no se conocen completamente de antemano.
Dependen de un suceso aleatorio impredecible e incontrolable por parte del que toma la decisión.
Por ejemplo, un agente de bolsa debe invertir una cantidad elevada de dinero y puede elegir entre
valores tecnológicos o valores del sector energético. La rentabilidad de su inversión depende de las
cotizaciones futuras en la bolsa del valor que elija. Sin embargo, es imposible predecir de antemano
el comportamiento exacto de las cotizaciones bursátiles para cada tipo de valor, que depende de
variables fuera del alcance de nuestro inversor.
En los problemas de decisión con incertidumbre que analizamos confluyen sistemáticamente dos
factores de naturaleza muy distinta para determinar el resultado o efecto de una decisión. Por un
lado, es importante la alternativa que elige el individuo de entre el conjunto de alternativas posibles
1
Estos apuntes pueden contener errores tipográficos o incluso de cálculo y no cubren necesariamente todo la
materia proporcionada en clase por el profesor. En caso de encontrar errores, podéis escribir a ancalvo@eco.uc3m.es
(Antoni Calvó Armengol).

1
(por ejemplo, invertir en valores tecnológicos o en valores del sector energético, probablemente de
rentabilidad distinta). Por otro lado, también son determinantes los factores aleatorios inherentes
a la incertidumbre del problema analizado (en este caso, las cotizaciones bursátiles son sujetas a
variaciones impredecibles). La alternativa es la única variable de control (o variable endógena) del
individuo que toma la decisión, que hace frente además a unos sucesos aleatorios incontrolables (o
variable exógena) que también intervienen de la determinación de sus pagos.
En presencia de incertidumbre, las alternativas disponibles son meras loterías de consecuencias
impredecibles. Tomar una decisión es, pues, sinónimo de apostar por una lotería. Tomar una buena
decisión consiste simplemente en realizar una buena apuesta.

La matriz de decisión A
Introducción
Todo problema de decisión en situaciones de incertidumbre se caracteriza por los dos elementos
siguientes:

• la decisión es decir, la elección de una alternativa de entre un conjunto o lista de alternativas


disponibles,

• la consecuencia de esta decisión, que el individuo que toma la decisión no conoce con exactitud
de antemano ya que depende no sólo de su elección sinó también de un evento aleatorio
impredecible que no controla. Para representar estas consecuencias inciertas introducimos:

— la lista de los estados posibles de la naturaleza o eventos impredecibles no controlables


por parte del individuo que toma la decisión,
— las consecuencias de cada alternativa en cada uno de estos estados posibles de la natu-
raleza,
— la información del individuo que toma la decisión sobre la posibilidad de ocurrencia de
los distintos estados de la naturaleza.

En este apartado nos centramos en las tres primeras características de un problema de decisión
es decir, la lista de alternativas, la lista de estados de la naturaleza y las consecuencias de cada
alternativa en cada estado. La cuarta característica (la información del individuo) será objeto de
la próxima sección.
La lista de los estados de la naturaleza debe constituir un conjunto de eventos mutuamente ex-
cluyentes y colectivamente exhaustivos. Mutuamente excluyentes significa que no puede producirse
nunca más de un único evento de la lista simultáneamente. Colectivamente exhaustivos significa
que siempre se produce al menos un estado de la lista. Supongamos por ejemplo que un individuo
se plantea ir al monte pero teme la nieve ya que no sabe conducir con la calzada nevada. La con-
secuencia (disfrutar o pasar un mal rato) de su decisión (ir o no ir al monte) depende de si nieva
o no. La lista {nevar, no nevar} es una lista de estados de la naturaleza mutuamente excluyentes
(¡nunca pueden producirse los dos eventos nevar y no nevar simultáneamente!) y colectivamente
exhaustivos (siempre se produce al menos un evento: o nieve, o no). Además, estos eventos son rel-
evantes para el problema de nuestro individuo al que sólo interesa la presencia o ausencia de nieve.
Por el contrario, la lista {nevar, llover} no es colectivamente exhaustiva pues un día soleado no se

2
recoge en ninguna categoría de la lista. Del mismo modo, la lista {nevar, no nevar, estar nublado}
no es mutualmente exclusiva pues si nieva entonces necesariamente también está nublado (también
puede estar nublado sin nevar).

Definición
Introducimos la matriz de decisión A a partir del problema de decisión siguiente. Una joven licen-
ciada en ingeniería de telecomunicaciones quiere crear su propia empresa de servicios en internet.
Para ello debe adquirir equipos informáticos (servidor, modems, etc.). Los equipos disponibles en
el mercado ofrecen prestaciones muy variadas, siendo más caros cuanto mayor su capacidad de
comunicación y tratamiento de datos. Nuestra ingeniera duda entre adquirir equipos de baja, me-
diana o alta capacidad de coste de adquisición respectivamente bajo, mediano y alto. La lista de
alternativas disponibles o decisiones posibles contiene tres elementos (d1 , d2 , d3 ), que son:

 d1 : adquirir equipos de baja capacidad
d2 : adquirir equipos de mediana capacidad

d3 : adquirir equipos de alta capacidad
La futura empresaria desconoce la demanda real que conseguirá atraer y que deberá atender
con su nuevo servicio y se pregunta qué inversión en infraestructura de comunicación debe realizar.
Piensa que su empresa puede tener poco, relativo o mucho éxito y abastecer poca, relativa o mucha
demanda. El tamaño de esta demanda real depende, sobretodo, de elementos propios al mercado
en internet sobre los que tiene poca influencia (número de competidores futuros, mejora de la
tecnología, interés por el nuevo producto, etc). El tamaño de su demanda es, en este caso, un
evento impredecible, aleatorio y no controlable por parte de nuestra ingeniera. La lista de los
posibles tamaños de la demanda constituye la lista de estados de la naturaleza. Anotamos (e1 , e2 , e2 )
en esta lista donde:

 e1 : poca demanda
e2 : relativa demanda

e3 : mucha demanda
Obviamente, los beneficios de la empresa dependen de la decisión dj de inversión a realizar en
capacidad de comunicación (variable de control de la ingeniera) y del éxito de la empresa medido por
la demanda real del producto o estado de la naturaleza ei (variable no controlable por la ingeniera).
Los beneficios de la empresa son consecuencia de la decisión dj adoptada, que depende también del
estado ei acaecido. Anotamos a (ei , dj ) = aij la consecuencia de la decisión dj en el estado ei . En
nuestro ejemplo, si la creadora de empresas invierte en unos equipos informáticos de baja capacidad
(alternativa d1 ), la empresa obtendrá 40.000 Euros de beneficios con poca demanda (estado de la
naturaleza e1 ) es decir, a (e1 , d1 ) = a11 = 40 (en miles de Euros); 10.000 Euros de pérdidas si la
demanda es relativa (estado de la naturaleza e2 ), es decir, a (e2 , d1 ) = a21 = −10; y equilibrará
cuentas en caso de mucha demanda (estado de la naturaleza e3 ) es decir, a (e3 , d1 ) = a31 = 0.
Si por el contrario los equipos adquiridos son de capacidad media (alternativa d2 ) la empresa
equilibrará cuentas con poca demanda (a (e1 , d2 ) = a12 = 0), obtendrá 30.000 Euros de beneficios
con demanda relativa (a (e2 , d2 ) = a22 = 30) y 5000 Euros con mucha demanda (a (e3 , d2 ) = a32 = 5).
Finalmente, unos equipos de alta capacidad (alternativa d3 ) producirán 100.000 Euros de pérdidas
con poca demanda (a (e1 , d3 ) = a13 = −100), 10.000 Euros de beneficios con demanda relativa
(a (e2 , d3 ) = a23 = 10) y 20.000 Euros con mucha demanda (a (e3 , d3 ) = a33 = 20).

3
Dado un problema de decisión como el anterior, la lista (d1 , d2 , d3 ) de alternativas disponibles, la
lista (e1 , e2 , e3 ) de estados de la naturaleza posibles y las consecuencias a (ei , dj ) = aij de la decisión
dj , j = 1, 2, 3 en el estado ei , i = 1, 2, 3 pueden representarse en una única matriz de pagos A. En
esta matriz A, las alternativas dj dan nombre a las columnas, los estados de la naturaleza ei dan
nombre a las filas, y las consecuencias aij se sitúan a la intersección de la columna dj y de la fila ei :

d1 d2 d3
 
e1 40 0 −100
A = e2  −10 30 10 
e3 0 5 20

En general, la matriz de pagos A se escribe:

d1 · · · dn
 
e1 a11 · · · a1n
 .. .. 
A = ...  . ...
. 
em am1 · · · amn

Criterios de elección
Supongamos que nos encontramos ante un problema de decisión representado por una matriz de
pagos A donde la lista de alternativas posibles (d1 , . . . , dn ) da nombre a las columnas y la lista
de estados posibles de la naturaleza (e1 , . . . , em ) da nombre a las filas. El individuo que debe
tomar la decisión debe elegir una alternativa dj de la lista (d1 , . . . , dn ). Sin embargo, al tomar su
decisión, el individuo no puede asegurarse de la consecuencia de su elección. Efectivamente, si elige
dj sabe que puede obtener el pago a (e1 , dj ) = a1j si se cumple el estado de la naturaleza e1 , el pago
a (em , dj ) = amj si se cumple el estado em o, más generalmente, el pago a (ei , dj ) = aij cuando se
cumple ei . Dicho de otro modo, la consecuencia de cualquier decisión es incierta y constituye una
lotería. Tomar una decisión significa simplemente elegir o extraer una de las n columnas de pagos
posibles que constituyen la matriz de decisión A.

d1 · · · dj · · · dn dj
   
e1 a11 · · · a1j · · · a1n a1j
..  .. .. ... ..   .. 
.  . . .   . 
  decisión dj  
A = ei  ai1 · · · aij · · · ain  y  aij 
..  . ... .. ..   . 
.  .. . .   .. 
em am1 · · · amj · · · amn amj

Elegir dj consiste en ceñirse a la columna de pagos a1j , . . . , aij , . . . , amj que corresponden a
las diferentes consecuencias posibles de la alternativa dj en cada estado de la naturaleza posible.
En estas circunstancias, tomar una decisión implica “comparar” columnas de pagos o consecuencias
posibles entre sí. Tomar una decisión es pues sinónimo de apostar por una lotería de pagos inciertos.
A continuación indicamos dos métodos posibles de comparación o criterios de elección de alter-
nativas, aplicables a un problema de decisión representado por una matriz de decisión A.

4
El criterio maxmin
Consiste en las tres etapas siguientes:
(1) Para cada decisión dj , se detecta el mínimo pago. Se trata de identificar la peor consecuencia
posible asociada a cada decisión.

min {a1j , a2j , . . . , amj } =min {aij }


i

Ejemplo: en el caso de la ingeniera que quiere crear una empresa de servicios internet tenemos,

 para d1 : min {40, −10, 0} = −10
para d2 : min {0, 30, 5} = 0

para d3 : min {−100, 10, 20} = −100

(2) Se detecta el beneficio máximo entre los mínimos. Se trata de identificar el mayor beneficio
entre todos los escenarios pesimistas para evitar los peores. En otros términos, el individuo que
toma la decisión es pesimista y elige la decisión cuyo pago menor es el máximo.
n o
max min {ai1 } , min {ai2 } , . . . , min {ain } =maxmin {aij }
i i i j i

Ejemplo (sigue): max {−10, 0, −100} = 0


(3) Se toma la decisión cuyo mínimo sea el máximo entre todos los mínimos es decir, el maxmin.
Ejemplo (sigue): el maxmin es d2 .

El criterio maxmax
Consiste en las tres etapas siguientes:
(1) Para cada decisión dj , se detecta el máximo beneficio. Se trata de identificar la mejor
consecuencia posible de cada decisión.

max {a1j , a2j , . . . , amj } =max {aij }


i

Ejemplo: 
 para d1 : max {40, −10, 0} = 40
para d2 : max {0, 30, 5} = 30

para d3 : max {−100, 10, 20} = 20

(2) Se detecta el pago máximo entre los máximos. Se trata de identificar el mayor beneficio
entre todos los escenarios optimistas es decir, buscar el mejor de los mejores. En otros términos, el
individuo que toma la decisión es optimista y elige la decisión por la cual el mayor pago posible es
máximo. n o
max max {ai1 } , max {ai2 } , . . . , max {ain } =maxmax {aij }
i i i j i

Ejemplo (sigue): max {40, 30, 20} = 40


(3) Se toma la decisión cuyo máximo sea el beneficio máximo entre todos los beneficios máximos
es decir, el maxmax.
Ejemplo (sigue): el maxmax es d1 .

5
Discusión
Ni el criterio de decisión maxmin (que da lugar a la elección de la alternativa d2 es decir, inversión
en equipos de mediana capacidad) ni el criterio de elección maxmax (que da lugar a la elección de
la alternativa d1 es decir, inversión en equipos de baja capacidad) toman en cuenta las distintas
probabilidades p (e1 ) , . . . , p (em ) de ocurrencia de los distintos estados posibles de la naturaleza
e1 , . . . , em . Por ejemplo, si sabemos de antemano y sin ninguna incertidumbre que la empresa
generará mucha demanda de servicio es decir, si el estado de la naturaleza correspondiente e3
se cumple con toda certidumbre (p (e3 ) = 1), la decisión óptima para la ingeniera es invertir en
equipos de alta capacidad es decir, elegir la alternativa d3 . Si, por el contrario, todo apunta a
una futura demanda relativa es decir, p (e2 ) = 1, cabe adquirir los equipos mejor adaptados de
mediana capacidad, es decir, se tomará la decisión d2 . Finalmente, si se prevé poca demanda sin
incertidumbre alguna, es decir, p (e1 ) = 1, el equipo informático ideal es el de baja capacidad, es
decir, d1 .
El maxmin huye de los peores beneficios: −100 = a13 y −10 = a21 . El maxmax busca el mejor
de los mejores beneficios: 40 = a11 . ¿Qué sentido tiene evitar −100 (minmax ) o apostarlo todo por
40 (maxmax ) cuando se sabe de antemano y con toda certeza que no habrá poca demanda, es decir
p (e1 ) = 0? En la sección siguiente se desarrolla un criterio que tenga en cuenta las probabilidades
de los distintos estados de la naturaleza.

El criterio del valor esperado monetario V EM o ganancia


esperada
El vector de probabilidades P
Completamos la descripción del problema de decisión con un vector que nos indica las probabilidades
p (ei ) = pi de ocurrencia de los distintos estados de la naturaleza e1 . Denotamos por P a este vector:
   
p (e1 ) p1
 ..   .. 
 .   . 
   
P =  p (ei )  =  pi 
 ..   .. 
 .   . 
p (em ) pm

P resume la información del individuo que toma la decisión sobre la realización de los estados
posibles de la naturaleza. En el ejemplo anterior de creación de una empresa en internet, la inge-
niera puede tener previsiones sobre la demanda que generará su servicio (poca, relativa, mucha) =
(e1 , e2 , e3 ) atribuyendo una probabilidad p (ei ) a cada tipo posible de demanda por lo que se obtiene
un vector de probabilidades:    
p (e1 ) p1
P =  p (e2 )  =  p2 
p (e3 ) p3
P
3 P
3
que obviamente satisface la condición p (ei ) = pi = p1 + p2 + p3 = 1.
i=1 i=1

6
Un problema de decisión queda representado por el par (A, P):
 
d1 · · · dj · · · dn
 e  a · · · a1j · · · a1n
  
p1 
 1 11 
 ..  .. .. ... ..   .. 
 .  . . .   . 
    
(A, P) =  ei  ai1 · · · aij · · · ain ,  pi 
 ..  ..   . 
 .  ..
. ... ..
. .   .. 
 
 em am1 · · · amj · · · amn pm 

Por ejemplo, en el caso de la creación de una empresa internet:


 
d1 d2 d3
    
 e1 40 0 −100 0, 3 
 
(A, P) =  e2  −10 30 10 ,  0, 5 
 
 e3 0 5 20 0, 2 

El criterio V EM
El criterio del valor esperado monetario (ganancia esperada) consiste en las tres etapas siguientes:
(1) Para cada decisión dj , se calcula el valor esperado monetario (ganancia esperada) correspon-
diente al vector de probabilidades P
Xm
V EM (dj ) = p (e1 ) a1j + p (e2 ) a2j + · · · + p (em ) amj = p (ei ) aij
i=1
m
X
= p1 a1j + p2 a2j + · · · + pm amj = pi aij
i=1

Ejemplo: 
 V EM (d1 ) = 0, 3 × 40 + 0, 5 × (−10) + 0, 2 × 0 = 7
V EM (d2 ) = 0, 3 × 0 + 0, 5 × 30 + 0, 2 × 5 = 16

V EM (d3 ) = 0, 3 × (−100) + 0, 5 × 10 + 0, 2 × 20 = −21

(2) Se detecta el valor esperado monetario (ganancia esperada) máximo.


( m )
X
max {V EM (d1 ) , V EM (d2 ) , . . . , V EM (dn )} =max {V EM (dj )} =max pi aij
j j
i=1

Ejemplo (sigue): max {V EM (d1 ) , V EM (d2 ) , V EM (d3 )} = max {7, 16, −21} = 16
(3) Se toma la decisión cuyo valor esperado monetario (ganancia esperada) sea el máximo entre
todos los valores esperados monetarios (ganancias esperadas). Esta decisión es la decisión óptima
y la ganancia esperada asociada el valor esperado monetario de la decisión óptima, anotado V EM ∗
Ejemplo (sigue): la decisión óptima es d2 y el valor esperado monetario de la decisión óptima
V EM ∗ = 16.

7
Ejercicios
Para los ejercicios descritos a continuación, se trata primero de expresar la situación descrita en
términos de una matriz de pagos A y un vector de probabilidades P, para luego aplicar el criterio
V EM de elección de una alternativa. La dificultad del ejercicio, cuando la hay, consiste en identificar
correctamente el conjunto de alternativas sobre el que recae la decisión, la lista completa de estados
de la naturaleza y los pagos del individuo para cada decisión en cada uno de los estados posibles.
Asimismo, la obtención de P puede también a veces ser dificultosa.

Ejercicio 1
Enunciado: un ordenador genera aleatoriamente un número del 1 al 4 (1, 2, 3 ó 4). Determine si un
individuo que maximice la ganancia esperada apostaría 10 euros a uno de los números si el premio
en caso de acertar es de 30 euros.
Solución:
d1 d2 d3 d4 d5
q q q q q
1 2 3 4
  ∅
e1 =1 20 −10 −10 −10 0
e =2  
 −10 20 −10 −10 0 
A= 2
e3 = 3  −10 −10 20 −10 0 
e4 =4 −10 −10 −10 20 0

 1

4
 1 
P=

4
1


4
1
4

½ 1
V EM (d1 ) = · · · = V EM (d4 ) = 4
× (−20) + 34 × 10 = −2, 5
V EM (d5 ) = 0 = V EM ∗

La solución óptima para el jugador es no apostar (d5 ) y el valor esperado monetario de esta
decisión es V EM ∗ = 0.

Ejercicio 5
Enunciado: en una partida de cartas entre los jugadores A y B, A ha apostado 50 euros y B sólo 30
euros. Ahora B debe decidir si ver (igualar) la apuesta de A o retirarse. B cree que la probabilidad
de que la jugada de A sea mejor es 0.4. Determine qué debe hacer B.
Solución:
d1 d2
q q
· B ve B no ve ¸
e1 = A mejor jugada −50 −30
A=
e2 = A peor jugada 50 −30

· 4
¸
P= 10
6
10

8
½ 4 6
V EM (d1 ) = 10 × (−50) + 10
× 50 = 10 = V EM ∗
V EM (d2 ) = −30
La decisión óptima para el jugador B es ver (d1 ) y el valor esperado monetario de esta decisión
es V EM ∗ = 10.

Ejercicio 6
Enunciado: Jorge tiene el coche averiado y debe decidir si repararlo o reemplazarlo por otro coche
usado cuyo precio es 900 euros. Reparar su coche costaría 300 euros si la avería es leve y 1.500 euros
si es grave. La probabilidad de que la avería sea grave es 23 . El objetivo de Jorge es conseguir un
medio de transporte al menor coste esperado posible. ¿Debería reparar su coche o reemplazarlo?
Solución:
d1 d2
q q
reparar reemplazar
· ¸
e1 = avería leve −300 −900
A=
e2 = avería grave −1.500 −900
· 1 ¸
P = 32
3

½
V EM (d1 ) = 13 × (−300) + 23 × (−1500) = −1.100
V EM (d2 ) = −900 = V EM ∗
La decisión óptima para Jorge es reemplazar el coche (d2 ) y el valor esperado monetario de esta
decisión es V EM ∗ = −900.

Ejercicio 3
Enunciado: un agente de ventas por teléfono posee una lista de consumidores potenciales, así como
sus números de teléfono. Cada día puede hacer un número limitado de llamadas. Cada llamada
telefónica le cuesta 1 euro y por cada venta que realiza recibe 20 euros de comisión. Su experiencia
le dice que, de cada 10 llamadas, en 3 tiene suerte y consigue hablar con la persona indicada en
la lista. Además, cuando consigue hablar con la persona indicada, 2 de cada 10 de ellas compra el
producto.
(a) Dibujar el árbol de decisión ¿Cuál es el valor esperado de cada llamada telefónica?
(b) La compañía telefónica también ofrece el servicio “persona-a-persona”. Con este servicio se
paga un precio p por llamada sólo si se consigue contactar con la persona deseada. ¿Cuál es
el p máximo que el vendedor estaría dispuesto a pagar por cada llamada persona-a-persona?
Solución:
d1 d2
q q
normal pers-a-pers
 
e1 = no contesta −1 0
A = e2 = contesta y no compra  −1 −p 
e3 = contesta y compra 19 20 − p

9
 7
  7

10 10
P= 3
10
× 8
10
= 24
100

3 2 6
10
× 10 100

½ 7 24 6 2
V EM (d1 ) = 10
× (−1) + 100 × (−1) + 100 × 19 = 10
V EM (d2 ) = 7
10
24
× 0 + 100 6
× (−p) + 100 × (20 − p) = 12−3p
10
10
El servicio “persona-a-persona” es la decisión óptima si se cumple 12 − 3p ≥ 2 ⇔ p ≤ 3
. El
vendedor está dispuesto a pagar como máximo p∗ = 3, 33 euros por este servicio.

El árbol de decisión
Definición
Hasta ahora hemos representado los problemas de decisión en situación de incertidumbre mediante
una matriz de pagos y un vector de probabilidades (A, P). Existen otras formalizaciones posibles
para un problema de decisión, caracterizado por (recordémoslo) una lista de alternativas, una lista
de estados posibles de la naturaleza, las consecuencias o pagos de cada alternativa en cada estado,
y la información del individuo que toma la decisión sobre las posibles realizaciones de los distintos
estados de la naturaleza.
En particular, un problema de decisión puede representarse gráficamente en forma de árbol de
decisión. Un árbol de decisión se comprende de:

• una serie de nodos o puntos de toma de decisión de donde emanan tantas ramas como alter-
nativas existen (cada rama representa un alternativa posible): nodo de decisión representado
por un cuadrado ¤;
• una serie de nodos de donde emanan tantas ramas como estados de la naturaleza posibles en
aquel nodo (una rama representa un estado de la naturaleza): nodo de azar representado por
un círculo °;
• sobre cada rama representando un estado de la naturaleza, la probabilidad de ocurrencia del
mismo a partir del nodo;
• sobre cada nodo terminal, un valor indicando la ganancia correspondiente al curso de acción
que desemboca en el nodo.

El nodo inicial del arbol de decisión puede ser una acción aleatoria de la naturaleza (nodo de
azar °) o una acción del decisor (nodo de decisión ¤). Las alternativas se disponen secuencialmente
sobre el arbol como si se ordenaran en el tiempo. El problema de decisión se resuelve por inducción
hacia atrás, sustituyendo los nodos de azar por el valor esperado monetario en aquel nodo. Esta
ganancia esperada es la suma de los pagos en los nodos terminales inmediatamente posteriores
al nodo, ponderados por las probabilidades indicadas sobre las ramas. En general, adoptamos el
árbol de decisión en problemas de decisión secuenciales, donde la elección del individuo afecta una
secuencia de acciones. Por el contrario, la matriz de pagos es particularmente apropiada para
decisiones aisladas.

10
Ejercicio 2
Enunciado: se lanza una moneda y se anticipa el resultado (cara o cruz). Si se acierta, se cobran 10
euros y se tiene la posibilidad de volver a jugar y, así, hasta tres lanzamientos de la moneda. Si se
falla, se devuelve todo el dinero que se ha ganado y no se tiene la oportunidad de seguir jugando.
Al final del juego hay que pagar 2 euros por cada apuesta. Determine la decisión que maximiza la
ganancia esperada.
Solución: Si organizamos los datos según el formato (A, P), obtenemos (+ indica apostar a Cruz
y C indica apostar a Cara):

• 14 alternativas distintas:
 
 +,C , ++,CC,+C,C+ , +++,CCC,++C,+C+,C++,CC+,C+C,+CC ;
|{z} | {z } | {z }
1 apuesta 2 apuestas 3 apuestas

• 8 estados posibles de la naturaleza:

(+++,CCC,++C,+C+,C++,CC+,C+C,+CC) ;

• en definitiva, una matriz de decisión A 8 × 14 con 112 casillas de consecuencias posibles para
cada una de las 14 alternativas en cada uno de los 8 estados posibles de la naturaleza.

En este caso, la representació gráfica en forma de árbol de decisión es más intuitiva, cómoda e
inmediata. A significa apostar y qA significa no apostar. Como la moneda no está sesgada, cuando
el individuo apuesta, gana (G) con probabilidad 1/2 y pierde (P ) con idéntica probabilidad 1/2.
24
½
½
½
1
G½: 2
°½
A½½Z PZ: Z
1
½ 2
½
2 Z
½Z Z
½
1
G½: 2 Z −6
Z
qA
½
° Z
A½½ZP Z
: 1
Z
16
½ Z
2
½ Z
½2Z Z
½
1
G½: 2 Z −4
qAZ
°½ Z
A½½ZP Z
: 1
Z
8
½ Z
2

Z
Z
Z
Z −2
qAZZ
Z
0
Resolver este juego por inducción hacia atrás supone sustituir los nodos de azar y los eventos
aleatorios que emanan de ellos por la ganancia esperada en aquel nodo. En este caso, en el último

11
nodo de azar, el individuo gana 24 con probabilidad 1/2 o pierde −6 con idéntica probabilidad
1/2. En este nodo, obtiene una ganancia esperada igual a 12 × 24 + 12 × (−6) = 9. El árbol puede
simplificarse al sustituyendo las últimas ramas por esta ganancia esperada 9, que agrega toda la
información disponible sobre lo que puede acontecer en aquel nodo (ganar 24 o perder −6 con
probabilidades respectivas 1/2 y 1/2). Obtenemos:

9
½
A½½
½
½
2
½Z
G½: ½
1 Z
½
°
2
qAZZ
½Z
A½ PZ: 1 Z
16
½ Z
2
½ Z
½2Z Z
G½: ½
1 Z
Z
−4
°½
2
qA Z
½ Z
A½ PZ: 1 Z
8
½ Z
2

Z
Z
Z
Z −2
Z
qA Z
Z
0

Obviamente, en la última etapa del juego (tercer lanzamiento) el jugador prefiere no apostar
(qA) y obtener 16 a apostar (A) y obtener un ganancia esperada igual a 9. Podemos pues sustituir
el último nodo de decisión por el resultado de la decisión racional en este nodo es decir, 16.

½
16
½
G½: ½
1
2
½
°
A½½ZPZ: Z
1
½ 2
½
2 Z
½Z Z
G½: ½
1 Z
Z
−4
°½
2
qA Z
A½½ZP Z
: 1
Z
8
½ Z
2

Z
Z
Z
Z −2
qAZZ
Z
0
Iteramos el proceso de inducción hacia atrás calculando la nueva ganancia esperada en el último
nodo de azar 12 × 16 + 12 × (−4) = 6. El jugador prefiere no apostar en un segundo lanzamiento

12
(qA) y obtener 8 a apostar (A) y obtener un ganancia esperada igual a 6.

6
½
A½½
½
½
½2Z
G½: ½
1 Z
°½
2
qAZZ
A½½ZP Z
: 1
Z
8
½ Z
2

Z
Z
Z
Z −2
qAZZ
Z
0
Finalmente, la última ganancia esperada es igual a 12 ×8+ 12 ×(−2) = 3 por lo que el jugador prefiere
apostar para un primer lanzamiento y ganar 3 (en términos esperados) a no apostar y quedarse con
0.

3
½
A½½
½

Z
Z
qAZZ
Z
0

El valor de la información perfecta


Definición
Sea un problema de decisión (A, P). Cuando un individuo posee información perfecta sabe, antes de
tomar la decisión y sin incertidumbre, el estado de la naturaleza que va a realizarse. Si el individuo
sabe que va a ocurrir el estado ei sin ambigüedad, es decir, p (ei ) = pi = 1, la decisión óptima es
simplemente aquélla que maximiza las ganancias en la fila correspondiente a ei . Denotamos por Mi
el pago correspondiente a la decisión óptima con información perfecta sobre el estado ei :

Mi = max {ai1 , ai2 , . . . , ain } =max {aij }


j

El valor esperado monetario con información perfecta V EM IP se calcula simplemente sumando


los pagos Mi correspondientes a las decisiones óptimas en cada estado ponderados por la probabil-
idad p (ei ) = pi de ocurrencia de cada uno de los estados:

Xm
V EMIP = p (e1 ) M1 + p (e2 ) M2 + · · · + p (em ) Mm = p (ei ) Mi
i=1
m
X
= p1 M1 + p2 M2 + · · · + pm Mm = pi Mi
i=1

13
Ejemplo: en el caso de creación de una empresa de servicios en internet por parte de una recién
licenciada en ingeniería de telecomunicaciones recordemos que:
   
40 0 −100 0, 3
(A, P) =  −10 30 10  ,  0, 5 
0 5 20 0, 2

Por consiguiente: 
 M1 = max {40, 0, −100} = 40
M2 = max {−10, 30, 10} = 30

M3 = max {0, 5, 20} = 20
De donde deducimos que V EM IP = 0, 3 × 40 + 0, 5 × 30 + 0, 2 × 20 = 31.
Un individuo que conoce exactamente el estado ei que va a realizarse puede asegurarse un pago
Mi en cada uno de estos estados. El valor esperado monetario en información perfecta V EM IP
indica la ganancia esperada de aquel individuo que pudiera adaptar su decisión al estado realizado
después de esta realización.
En condiciones de incertidumbre, la toma de decisión debe producirse antes de la realización
del estado de la naturaleza, cuando todo aún es posible. La decisión tomada no puede revisarse y
se mantendrá una vez conocido el estado de la naturaleza, sea cual sea. Si el individuo que toma
la decisión se rige según el criterio de la ganancia esperada o valor esperado monetario, prevé una
ganancia igual a V EM ∗ que es la ganancia esperada correspondiente a su decisión óptima. Es fácil
ver que:

V EM IP ≥ V EM ∗

Poseer información perfecta aumenta la ganancia esperada en la cantidad V EM IP −V EM ∗ ≥ 0.


Por definición, esta diferencia es el valor de la información perfecta V IP :

V IP = V EMIP − V EM ∗

El valor de la información perfecta V IP nos indica el valor máximo que el individuo está
dispuesto a pagar para librarse de la incertidumbre, comprar información y tomar su decisión con
información perfecta sobre lo que va a suceder. Si el coste c de adquisición de la información es
inferior al valor de la información perfecta V IP , c < V IP , el individuo encargado de tomar la
decisión prefiere comprar la decisión y eliminar la incertidumbre. Si, por el contrario, el coste c es
mayor que el valor de la información perfecta V IP , c > V IP , el decisor prefiere no comprar la
información que se le ofrece y tomar su decisión en condiciones de incertidumbre. La indiferencia
entre comprar y no comprar la información ocurre cuando c = V IP .
Ejemplo: en el caso de creación de una empresa internet y inversión en equipos informáticos con
desconocimiento de la demanda futura del servicio tenemos: V IP = 31 − 16 = 51.

Ejercicios
Ejercicio 1
Solución: calculamos el pago Mi asociado a la decisión óptima con información perfecta para cada
estado ei . Obtenemos:

14


 M1 = max {20, −10, −10, −10, 0} = 20

M2 = max {−10, 20, −10, −10, 0} = 20

 M = max {−10, −10, 20, −10, 0} = 20
 3
M4 = max {−10, −10, −10, 20, 0} = 20
£ ¤
Con el vector de probabilidades P = 14 , 14 , 14 , 14 calculamos el valor esperado monetario con
información perfecta:
1 1 1 1
V EM IP = × 20 + × 20 + × 20 + × 20 = 20
4 4 4 4
Sabemos que el valor esperado monetario asociado a la decisión óptima (según el criterio de la
ganancia esperada) es V EM ∗ = 0, de donde deducimos el valor de la información perfecta:

V IP = V EM IP − V EM ∗ = 20

Ejercicio 5
Solución: calculamos el pago Mi asociado a la decisión óptima con información perfecta para cada
estado ei . Obtenemos:
½
M1 = max {−50, −30} = −30
M2 = max {50, −30} = 50
£4 6¤
Con el vector de probabilidades P = 10 , 10 calculamos el valor esperado monetario con infor-
mación perfecta:
4 6
V EM IP = × (−30) + × 50 = 18
10 10
Sabemos que el valor esperado monetario asociado a la decisión óptima (según el criterio de la
ganancia esperada) es V EM ∗ = 10, de donde deducimos el valor de la información perfecta:

V IP = V EMIP − V EM ∗ = 8

Ejercicio 6
Solución: obtenemos:
½
M1 = max {−300, −900} = −300
M2 = max {−1500, −900} = −900
£ ¤
Con el vector de probabilidades P = 13 , 23 calculamos:
1 2
V EM IP = × (−300) + × (−900) = −700
3 3
Sabemos que el valor esperado monetario asociado a la decisión óptima (según el criterio de la
ganancia esperada) es V EM ∗ = −900, de donde deducimos el valor de la información perfecta:

V IP = V EM IP − V EM ∗ = 200

15
Ejercicio 3
Solución: En este caso la información perfecta consiste en saber antes de la llamada si el potencial
cliente contestará al teléfono y si, además, comprará el servicio ofrecido. Obtenemos:

 M1 = max {−1, 0} = 0
M = max {−1, −p}
 2
M3 = max {19, 20 − p}
¡ 7 24 6 ¢
Con el vector de probabilidades p = 10 , 100 , 100 calculamos:

7 24 6
V EM IP = ×0+ × max {−1, −p} + × max {19, 20 − p}
10 100 100
Por consiguiente, si 0 < p < 1, M2 = −p y M3 = 20−p lo que implica que V EM IP = 1, 2−0, 3p.
Si por el contrario, p > 1, M2 = −1 y M3 = 19 de donde deducimos que V EM IP = 0, 9. Sabemos
que el valor esperado monetario asociado a la decisión óptima (según el criterio de la ganancia
esperada) es V EM ∗ = 0, 2 si p > 103
y V EM ∗ = 1, 2 − 0, 3p si p < 10 3
. Por consiguiente,

 V IP = (1, 2 − 0, 3p) − (1, 2 − 0, 3p) = 0 si 0 < p < 1
V IP = 0, 9 − (1, 2 − 0, 3p) = 0, 3 (p − 1) si 1 < p < 103

V IP = 0, 9 − 0, 2 = 0, 7 si 10
3
<p

16

Vous aimerez peut-être aussi