Académique Documents
Professionnel Documents
Culture Documents
decisiones
Guillaume Haeringer
Guillaume.Haeringer@uab.es
ii
Contenido
1 Introducci
on
1.1 Para que sirven estos apuntes? .
1.2 Errores comunes . . . . . . . . . .
1.2.1 Juegos en forma normal .
1.2.2 Juegos en forma extensiva
1.3 Libros . . . . . . . . . . . . . . .
.
.
.
.
.
2
2
2
2
4
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
8
9
10
11
12
12
16
18
19
21
22
30
30
30
33
33
3 Juegos secuenciales
3.1 Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Nodos de decisiones y estrategias . . . . . . . . . . . .
3.1.2 El equilibrio de Nash . . . . . . . . . . . . . . . . . . .
37
37
38
42
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Juegos Est
aticos con informaci
on completa
2.1 Elementos y definicion de un juego . . . . . . . . . . . . . .
2.2 Juegos en forma normal . . . . . . . . . . . . . . . . . . . .
2.2.1 Notaciones . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Algunas cosas importantes . . . . . . . . . . . . . . .
2.3 Estrategias estrictamente dominadas . . . . . . . . . . . . .
2.3.1 Estrategias dominadas pero no estrictamente . . . . .
2.3.2 Estrategias dominantes . . . . . . . . . . . . . . . . .
2.4 El equilibrio de Nash . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Ejemplo: competicion electoral . . . . . . . . . . . .
2.4.2 Estrategias puras/mixtas . . . . . . . . . . . . . . . .
2.4.3 Utilidad esperada . . . . . . . . . . . . . . . . . . . .
2.4.4 Calcular los equilibrios de Nash en estrategias mixtas
2.4.5 Dibujar los equilibrios de Nash . . . . . . . . . . . .
2.5 Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 El dilema de los prisioneros . . . . . . . . . . . . . .
2.5.2 La batalla de los sexos . . . . . . . . . . . . . . . . .
2.5.3 El juego de las monedas . . . . . . . . . . . . . . . .
2.5.4 El dupolio de Cournot . . . . . . . . . . . . . . . . .
CONTENIDO
3.2
3.3
3.4
3.5
3.6
3.7
iv
4 Juegos repetidos
4.1 Juegos repetidos finitamente . . . . . . . . . . . . . . . . . .
4.1.1 Ejemplo: el dilema de los prisioneros repetido 2 veces
4.1.2 Juegos con suma cero . . . . . . . . . . . . . . . . . .
4.1.3 El min-max . . . . . . . . . . . . . . . . . . . . . .
4.1.4 El max-min y los juegos repetidos . . . . . . . . . . .
4.1.5 Ejemplo: la batalla de los sexos repetido 2 veces . . .
4.1.6 El equilibrio de Nash . . . . . . . . . . . . . . . . . .
4.1.7 El equilibrio perfecto en subjuegos . . . . . . . . . .
4.2 Juegos repetidos infinitamente . . . . . . . . . . . . . . . . .
4.2.1 Descuento . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Ganancia media . . . . . . . . . . . . . . . . . . . . .
4.2.3 Ganancia factible . . . . . . . . . . . . . . . . . . . .
4.2.4 Equilibrio de Nash . . . . . . . . . . . . . . . . . . .
4.2.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
47
48
53
53
54
59
64
69
69
70
71
73
77
78
79
83
84
84
85
86
87
89
Captulo 1
Introducci
on
1.1
Para qu
e sirven estos apuntes?
Espero que estos apuntes os ayudaran para aprender y entender los elementos
de la teora de juegos que se estudiaran durante este curso. Es importante de
saber que estos apuntes no reemplazan las clases. Aqu he puesto definiciones,
teoremas y algunos ejemplos. Por cierto, es muy probable que en la clases
voy a contar mas que lo que esta en estos apuntes. Ademas, muchos de los
ejemplos que hemos visto, o que vamos a ver en la clase no estan en los
apuntes.
1.2
Errores comunes
He intentado en estos apuntes de explicar con mucho cuidado ciertos conceptos. Sin embargo, en el examen hay errores muy frecuentes. Aqu he listado
unas de ellas.
1.2.1
Cuando se calcula las probabilidades de un equilibrio de Nash en estrategias mixtas, si encuentras probabilidades negativas o mayor que
1, has hecho algo malo en los calculos. Un error com
un es el siguiente:
uj (a) = uj (b)
...
2q + 3 3q = 1
5
5q = 2 q = .
2
Introducci
on
Pero el echo de obtener sj tampoco significa que tenemos un equilibrio de Nash. Para que sea un equilibrio de Nash, tenemos que
obtener eso:
(ii) Cogemos sj y buscamos una (o la) mejor respuesta de i. Si no
obtenemos sj , entonces (
si , sj ) no puede ser un equilibrio de Nash.
En el caso contrario, (
si , sj ) es un equilibrio de Nash (porque ya
hemos verificado que (i) esta cierto).
1.2.2
Una acci
on de un jugador es lo que hace en un nodo. Una estrategia
es una lista de acciones para cada nodo de decision.
Un conjunto de informaci
on puede contener 2, 3 (o mas) nodos de
decision. Si en un nodo de un conjunto de informacion un jugador elige
una accion, deber ser el caso que elige la misma accion en los otros
nodos de decision del mismo conjunto de informacion.
Cuando tienes que trabajar con un juego secuencial, hacer la lista de
los conjuntos de informacion / nodos de decision de los jugadores puede
ayudar a entender las estructura de las estrategias de los jugadores.
Por ejemplo, si un jugador tiene 4 nodos de decision, cualquier estrategia de este jugador contiene 4 elementos: cada elemento describe una
accion para cada nodo.
1.3
Libros
Aqu hay una lista de libros que pueden ayudar. Sin embargo, todo esta hecho
para que estos apuntes y una presencia regular en la clase son suficientes para
preparar el examen.
Binmore, K.G., Teora de Juegos,, Mc Graw Hill 1994.
Dixit, A., Nalebuff, B., Pensar Estrategicamente, A. Bosch ed. 1992.
Gibbons, R., Un Primer Curso de Teora de Juegos , A. Bosch ed.
1993.
Kreps, D.M., Curso de Teora Microeconomica, McGraw-Hill 1995.
Rasmusen, E., Juegos e informacion. Introduccion a la Teora de Juegos, McGraw Hill 1995.
1.3 Libros
Vega Redondo F., Economa y juegos, teora y aplicaciones, A. Bosch
ed. 1999.
Los libros de Vega Redondo y de Gibbons son los mas adaptados para
esta asignatura.
Introducci
on
Captulo 2
Juegos Est
aticos con
informaci
on completa
Un juego estatico con informacion completa se llama un juego en forma
normal. En los juegos en forma normal los jugadores eligen sus estrategias
de manera simultanea, de forma que cada jugador elige su estrategia sin saber
que estrategias han elegido los demas jugadores.
En los captulos 3 y 4 vamos a estudiar juegos en los que los jugadores
pueden elegir sus acciones sabiendo las estrategias elegidas por los demas.
2.1
Elementos y definici
on de un juego
2.2
c
3, 1
5, 4
d
100, 52
2, 3
Juegos est
aticos
(2.1)
sj = s0j ,
si 6= s0i .
Si tenemos dos perfiles s y s0 que satisfacen estas condiciones escribimos
que s0 es el perfil obtenido con la estrategia s0i y las estrategias en el perfil s
de los jugadores distintos del jugador i:
s0 = (s0i , si ) ,
(2.2)
(2.3)
donde
es decir, si es la coleccion de las estrategias de todos los jugadores salvo el
jugador i.
2.2.1
Notaciones
a
b
c
2, 10
3, 7
d
1, 2
0, 15
L
R
3, 5, 0
1, 2, 10
100, 60, 80 6, 19, 21
U
D
L
R
8, 7, 4
13, 1, 9
89, 6, 74 20, 42, 15
2.2.2
c
1, 0
3, 7
d
100, 200
0, 10
Juegos est
aticos
10
a
b
c
1
3
d
100
0
2.3
c
0
7
d
200
10
c
3, 1
2, 4
d
10, 2
2, 1
En este juego, para el jugador i la estrategia b esta estrictamente dominada por la estrategia a. Con la estrategia a, el jugador i gana 3 o 10,
depende de la estrategia jugada por el jugador j. Pero con la estrategia b el
jugador i solo gana 2 o 2.
Para el jugador j, no hay una estrategia que domina a la otra. Si el
jugador i elige la estrategia a, el jugador prefiere la estrategia d, pero si
el jugador i elige la estrategia b la estrategia preferida del jugador j es la
estrategia c.
Con este juego, podemos decir que el jugador i nunca va a elegir la estrategia b. Entonces, es como si el juego fuera:
a
c
3, 1
d
10, 2
11
d
10, 2
2.3.1
Existe otro concepto de dominacion entre las estrategias pero mas debil. Para
un jugador, puede existir una estrategia que le da, a veces, una ganancia
estrictamente mayor que otra estrategia, pero un unos casos (es decir, con
unos perfiles de estrategias de los demas jugadores) tiene una ganancia igual.
En este caso, tenemos una relacion de dominacion entre las estrategias, pero
esta relacion no es estricta.
Definici
on 1 Para un jugador i, la estrategia si domina, pero no estrictamente, a la estrategia s0i si tenemos:
ui (si , si ) ui (s0i , si ) ,
, si Si
(2.5)
d
2, 1
2, 4
2, 4
e
f
10, 2
7, 2
2, 1 7, 1
2, 1 1, 3
Juegos est
aticos
12
embargo, este proceso de eliminacion reiterada puede llevar resultados distintos seg
un el orden con el que hemos hecho la eliminacion reiterada. Si solo
eliminamos las estrategias estrictamente dominadas el orden de eliminacion
no influye sobre el resultado final.
2.3.2
Estrategias dominantes
Cuando encontramos una estrategia que domina a cualquiera otra estrategia, esta estrategia se llama estrategia dominante. Del mismo modo que
para la dominacion, hacemos la diferencia entre una estrategia estrictamente
dominante y una estrategia dominante pero no estrictamente.
Si una estrategia domina estrictamente a todas las otras estrategias, entonce esta estrategia se llama estrictamente dominante.
Pero, si la estrategia domina pero no estrictamente a unas estrategias,
entonces es una estrategia dominante pero no estrictamente.
Por ejemplo, consideramos el juego siguiente:
a
b
c
d
4, 1
2, 1
1, 0
e
f
7, 3
45, 2
7, 4 4, 1
2, 1 1, 3
2.4
El equilibrio de Nash
ui (si , si ) ui (s0i , si ) .
(2.6)
13
c
d
4, 1 1, 1
6, 4 2, 1
Juegos est
aticos
14
c
10, 8
6, 1
d
3, 5
2, 4
15
a
b
c
Estrategia de i
a
b
c
d
3, 1
2, 4
1, 4
e
f
10, 2
7, 2
2, 1 7, 1
2, 1 1, 3
Mejor respuesta de j
e
f
d
d
Mejor respuesta de i
a
a
a
a
Mejor respuesta de i
a
a
b
Mejor respuesta de j
e
f
e
f
e
f
d
Juegos est
aticos
16
2.4.1
Ejemplo: competici
on electoral
17
Juegos est
aticos
18
2.4.2
Estrategias puras/mixtas
En los juegos que hemos visto en las secciones anteriores siempre hemos
utilizado las estrategias puras de los jugadores. Las estrategias puras eran
las estrategias a, b, d, etc.
Cuando describimos los conjuntos de estrategias en un juego siempre nos
referimos a las estrategias puras.
Sin embargo, podemos tener el caso que los jugadores utilizan una mezcla de estrategias, es decir, que un jugador utiliza unas estrategias con
ciertas probabilidades. Por ejemplo, podemos decir que el jugador i juega la
estrategia a con una probabilidad 13 y la estrategia b con una probabilidad 23 .
En este caso, decimos que el jugador i utiliza una estrategia mixta.
Definici
on 3 Una estrategia mixta es una distribuci
on de probabilidades sobres una estrategias puras.
Entonces, una estrategia pura tambien es una estrategia mixta: hay una
probabilidad 1 de jugar la estrategia pura y una probabilidad 0 de jugar
cualquiera otra estrategia.
Las estrategias mixtas se deben entender as: son planes estrategicos de
un jugador antes de jugar. Jugar la estrategia a con una probabilidad 1/3
y la estrategia b con una probabilidad 2/3 no es de hacer un tercio de a
y dos tercios de b, pero quiere decir que hay una probabilidad de 1/3 que
el jugador juegue la estrategia a y una probabilidad de 2/3 que el jugador
juegue la estrategia b. Por ejemplo, por la ma
nana una persona compra a
veces un periodico, y otras veces no lo compra. Al salir de casa hay una
probabilidad que compre un periodico y una probabilidad que no compre
periodico. Decir que jugar una estrategia mixta es semejante a jugar una
mezcla de las acciones correspondientes podra decir que una persona compra
19
10 paginas de un periodico, sin comprar el resto. Esta claro que eso no tiene
sentido.
Observaci
on 1 Una estrategia pura es tambien una estrategia mixta. Si un
jugador tiene por ejemplo dos estrategias puras, a y b, jugar la estrategia
a es, por definicion, jugar una estrategia pura. Pero tambien se puede ver
como una estrategia mixta:
Jugar a con una probabilidad 1,
Jugar b con una probabilidad 0.
Para no equivocarse, cada vez que hablaremos de estrategia mixta se tendr
a
que entender que es una estrategia que no es una estrategia pura.
2.4.3
Utilidad esperada
Como calcular las ganancias de los jugadores si uno utiliza una estrategia
mixta? El principio es muy simple y consiste en calcular la esperanza de la
ganancia de los jugadores.
Cogemos por ejemplo el juego siguiente:
c
d
4, 1 1, 1
2, 4 2, 1
a
b
1
3
2
3
1
2
1
2
1
2
y el jugador j gana:
1 con una probabilidad
-4 con una probabilidad
1
2
Juegos est
aticos
20
(2.7)
1
2
7
4 = .
(2.8)
3
3
3
Si el jugador j juega tambien una estrategia mixta, por ejemplo c con
una probabilidad 1/4 y d con una probabilidad 3/4, entonces tenemos que
los jugadores juegan:
Euj = 1
1
3
1
4
1
12
2
3
1
4
2
12
1
3
3
4
3
12
2
3
3
4
6
12
21
Proposici
on 2 En un juego en forma normal con n jugadores, con los conjuntos de estrategias puras S1 , . . . , Sn , funciones de ganancias, u1 , . . . , un ,
si el perfil s = (s1 , . . . , sn ) es un equilibrio de Nash, entonces sobrevive la
eliminacion reiterada de las estrategias estrictamente dominadas.
2.4.4
Sea G un juego y s = (s1 , . . . , sn ) un perfil de estrategias que es un equilibrio de Nash en el que el jugador i juega una estrategia mixta (que no es una
estrategia pura). Sea (s1i , s2i ) el soporte de la estrategia mixta de i, si . El
soporte de una estrategia mixta es el conjunto de todas las estrategias puras
que forman parte de la estrategia pura. Por ejemplo, si i tiene tres estrategias puras, s1i , s2i y s3i , pero su estrategia mixta consiste en utilizar solo las
estrategias s1i y s2i , entonces el soporte de su estrategia mixta es (s1i , s2i ).
Sea p la probabilidad que i juegue s1i en su estrategia mixta si (la estrategia del equilibrio de Nash) y 1 p la probabilidad que i juegue s2i . Vamos
a demonstrar que en este caso, las estrategias s1i y s2i tambien son mejores
respuestas de i contra la estrategia si .
Primero demonstramos que el jugador gana lo mismo con s1i que con s2i
cuando los demas jugadores juegan si . Para facilitar las cosas supongamos
que si es un perfil de estrategias puras. Supongamos que eso es falso.
Entonces, i gana mas con una estrategia, por ejemplo s1i , que con la otra, s2i ,
es decir,
ui (s1i , si ) > ui (s2i , si ) .
(2.9)
Pero si al equilibrio de Nash i juega s1i con una probabilidad p y s2i con
una probabilidad 1 p, la ganancia de i al equilibrio de Nash es:
ui (si , si ) = pui (s1i , si ) + (1 p)ui (s2i , si ) .
(2.10)
(2.11)
Juegos est
aticos
22
(2.12)
(2.13)
2.4.5
(2.14)
Para dibujar los equilibrios de Nash utilizamos las funciones de mejor respuesta. Para eso, utilizamos dos ejes, uno que representa la mejor respuesta
de i, y otro la mejor respuesta de j. Hay que recordarse que la mejor respuesta de j (o de i) consiste en coger una estrategia de i (o de j) y buscar
cual es la mejor, o las mejores estrategias de j (o de i). Vamos a dibujar
los equilibrios de Nash solo cuando cada jugador tiene dos estrategias puras.
En la observacion 1 hemos visto que una estrategia pura es tambien una
23
a
b
Si cogemos una estrategia de i, es decir un p entre 0 y 1, podemos saber
mirando a las ganancias de j cuales son sus mejores respuestas. Entonces,
dibujar la funcion de mejor respuesta de j consiste en dibujar una curva que
por cada p entre 0 y 1 nos da un q, lo cual indica la estrategia eligida por j
cuando i juega la estrategia que corresponde a este valor de p. Hacemos el
mismo para el jugador j. As pues, el objetivo es de obtener dos curvas, una
para i y una para j en el grafico de la Figura 2.1.
p
1
pi
Juegos est
aticos
24
t(a, c)
(a, d)
t(b, d)
a
b
5
6
q =
1
.
2
25
(2.15)
(2.16)
(2.17)
Juegos est
aticos
26
p
1
p 65
p
1
p =
5
6
27
Ahora, para completar necesitamos saber lo que pasa si p > 56 . Para ello,
cogemos la estrategia de i cuando p = 1, es decir, cuando i juega la estrategia
pura a. Si i juega a, la mejor respuesta de j es de jugar c, es decir, q = 1.
Entonces, lo que tenemos que hacer es:
Localizar en el dibujo el punto de coordinadas que corresponde al perfil
(a, c). Este punto es (1, 1).
Dibujar una recta horizontal que va de (1, 1) hasta la recta vertical
que hemos dibujado antes (en la Figura 2.3 en la pagina anterior).
Obtenemos el grafico de la Figura 2.5.
p
1
p =
5
6
(2.18)
donde el perfil (p, c) significa que j juega la estrategia pura c y i una estrategia
mixta en la que juega a con una probabilidad p, cuyo valor tenemos que
Juegos est
aticos
28
(2.19)
q =
1
2
p =
5
6
29
q =
1
2
p =
5
6
q =
1
2
p =
5
6
Juegos est
aticos
30
puntos de coordinadas (0, 0) y (1, 1): son los dos equilibrios en estrategias
puras. El equilibrio con coordinadas ( 56 , 12 ) es el u
nico equilibrio de Nash en
estrategias mixtas.
As pues, dibujar las funciones de mejor respuesta nos permite comprobar
el n
umero de los equilibrios de Nash y sus naturalezas (en estrategias puras
o mixtas).
2.5
Ejemplos
2.5.1
Hablar
Callarse
Callarse
0, 5
1, 1
2.5.2
A
B
2, 1 0, 0
0, 0 1, 2
31
2.5 Ejemplos
q
1
q
1
Juegos est
aticos
32
(2.20)
Si utiliza la estrategia A, y
Euj (B) = 0 p + 2 (1 p) = 2 (1 p) ,
(2.21)
Si utiliza la estrategia B.
El jugador j utiliza una estrategia mixta entre A y B si esta indiferente
entre la estrategia A y B, es decir, si su ganancia esperada cuando juega A
es la misma que su ganancia esperada cuando juega B (vease el ejercicio 7
en las hojas de ejercicio que he dada en diciembre). Eso es el caso si pi es la
solucion de:
2
p = 2(1 p) p = .
(2.22)
3
Es decir, si i juega A con una probabilidad p = 23 el jugador j esta indiferente
entre jugar a y jugar B. Del mismo modo podemos calcular el q con el que el
jugador i esta indiferente entre jugar A y jugar B, con q siendo la probabilidad
con la que el jugador j juegue A.
La ganancia esperada del jugador i si juega A es:
Eui (A) = 2 q + 0 (1 q) = 2q ,
(2.23)
y si utiliza la estrategia B es
Eui (B) = 0 q + 1 (1 q) = 1 (1 q) ,
(2.24)
q=
1
.
3
(2.25)
1
3
2
3
33
2.5.3
2.5 Ejemplos
Tenemos dos jugadores, i y j, y cada uno debe elegir entre Cara o Cruz. Si
los dos hacen la misma eleccion el jugador i da 1 euro al jugador j. Entonces,
la ganancia de i es 1 y la del jugador j es 1. Si los jugadores no hacen la
misma eleccion es al reves: el jugador j da un euro al jugador i. Entonces,
el juego es:
Cara
Cruz
Cara
1, 1
1, 1
Cruz
1, 1
1, 1
q =
1
2
p =
1
2
2.5.4
El dupolio de Cournot
Juegos est
aticos
34
(2.26)
(2.27)
(2.28)
(2.29)
(2.30)
(
q = a bqj ci
fi (qj ) = qi
i
2b
(2.31)
bq
i cj
fj (qi ) = qj
qj =
2b
35
2.5 Ejemplos
La u
nica solucion de este sistema es cuando tenemos
qi =
a + cj 2ci
3b
qj =
a + cj 2ci
.
3b
(2.32)
Entonces, el u
nico equilibrio de Nash en el duopolio de Cournot es cuando
las empresas i y j eligen las cantidades descritas en la ecuacion (2.32).
Si queremos dibujar las funciones de mejor respuestas de las empresas i
y j tenemos el dibujo de la Figura 2.12.
qj
a ci
a cj
2b
A
A
A
A
A
A
A
A
A
A
A uEquilibrio: q =
i
A
A
A
A
A
A
a ci
2b
a+cj 2ci
, qj
2b
a+ci 2cj
2b
qi
a cj
Juegos est
aticos
36
Captulo 3
Juegos secuenciales
En el capitulo anterior hemos visto los juegos en forma normal. En esos
juegos los jugadores juegan de manera simultanea, pero si queremos estudiar situaciones donde hay una dinamica tenemos que tener otro enfoque de
los juegos. Los juegos secuenciales y repetidos son juegos donde hay una
dinamica, es decir, hay acciones que deben estar elegidas (o jugadas) antes
de otras acciones. Por ejemplo, se puede ver el juego ir al cine como un
juego secuencial: primero pagamos el billete y luego podemos ver la pelcula
(o salir sin ver la pelcula). Las acciones ense
nar la pelcula y pagar el
billete no se realizan de manera simultanea. Primero pagamos el billete y
luego los operadores del cine nos ense
nan la pelcula.
3.1
Definici
on
Juegos secuenciales
38
c
r
2
4
ib
HH
HHb
a
H
j
HHjr
r
@
@ f
e
@d
@
@
@
@r
@r
r
1
5
6
12
230
1
3.1.1
39
3.1 Definici
on
una accion. En este juego, i tiene solo un nodo de decision pero j tiene 2.
Dicho de otra manera, un nodo de decision es una contingencia en la que
a un jugador le corresponde actuar. Por supuesto, en cada nodo de
decision solo hay un jugador. . .
Ahora que tenemos unos terminos mas para describir un juego en forma
extensiva podemos dar una definicion mas precisa de lo que es una estrategia.
Definici
on 4 Una estrategia de un jugador es un plan de acci
on completo, es decir, especifica una acci
on factible de este jugador en cada nodo
de decisi
on en lo que al jugador le pudiera corresponder actuar.
Si volvemos al juego de antes observamos que el jugador i tiene un u
nico
nodo de decision. Por lo que una estrategia de i solo contiene un elemento,
es decir una accion. En conjunto de estrategias de i es:
Si = {a, b} .
(3.1)
El caso del jugador j es mas interesante. Este jugador tiene dos nodos de
decision, uno despues de que i ha jugado a y el otro despues que i ha jugado
b, por lo que cada estrategia de j debe contener dos acciones: una para un
nodo y otra para el otro nodo. As, una estrategia de j puede ser:
jugar c si i ha jugado a
jugar f si i ha jugado b .
Otra estrategia podra ser
jugar c si i ha jugado a
jugar e si i ha jugado b .
Con estas estrategias esta claro que j juega despues de i, y que j puede jugar
c solo si i ha jugado a. Es decir, tenemos una dinamica en la descripcion del
juego, que aparece en las estrategias de los jugadores.
Por cierto, escribir as las estrategias de j es un poco feo, por lo que
escribimos solo las acciones que j elige en cada nodo. As pues, el conjunto
de estrategias de j es:
Sj = {(c, e), (c, f ), (d, e), (d, f )} .
(3.2)
Juegos secuenciales
40
c
r
2
4
a
j
r
@
@d
@
@r
1
5
HH
Hb
HH j
Hr
e f @@g
@
@r
r
r
6
230
8
1
9
12
(3.3)
(3.4)
(3.5)
Sj = {(c, e), (c, f ), (c, g), (d, e), (d, f ), (d, g)} ,
(3.6)
y el de j es:
(3.7)
41
3.1 Definici
on
c
r
2
4
ib
HH
HH
a
Hb
HH
H
HHj
jr
Hr
HH
@
H f
e
HH
@d
HHir
@
ir
@r
@
@ q
p
l
1
@m
@
@
@
10
@r
@r
r
r
2
3
1
4
5
0
5
4
(3.9)
(3.11)
Juegos secuenciales
42
r
(a, l, p)
p
a
ib
r
HH
l
q HH
Hr (a, l, q)
r
Q
r
Q
(a, m, p)
p
mQQ
Q
Qr
H
HH
q H
Hr (a, m, q)
r
(b, l, p)
p
@
@
@
b@@
r
HH
l
q HH
Hr (b, l, q)
@
@r
Q
r
Q
(b, m, p)
p
mQQ
Q
Qr
H
HH
q H
Hr (b, m, q)
3.1.2
El equilibrio de Nash
43
3.1 Definici
on
(3.12)
(3.13)
a
HH b
H
HH
H j
H
Hr
@
@ f
e
@
@
@r
r
jr
c
r
2
4
@ d
@
@
@r
1
10
5
0
5
4
Figura 3.5:
En este juego, los conjuntos de estrategias de i y j son respectivamente
Si = {a, b},
(3.14)
Juegos secuenciales
44
45
3.2 La inducci
on hacia atr
as
c
r
2
4
irb
HH
H
HH
HH
HH
a
Hb
HH
H
HH
H
HHj
jr
H
Hrr
H
H
@
@
@
@ d
@ f
e
@
@
@
@
@
@
@
@r
@
r
@r
1
10
5
0
5
4
3.2
La inducci
on hacia atr
as
5
0
5
4
Figura 3.7:
Este juego tiene dos equilibrios de Nash:
E1 = (a, e),
E2 = (b, f ) .
(3.15)
Juegos secuenciales
46
47
3.3
(3.16)
(3.17)
(3.18)
abqi 2bqj cj = 0
qj =
a bqi c
. (3.19)
2b
Juegos secuenciales
48
i (qi ) = q b qi +
2b
En este caso, la empresa i va a elegir el nivel de produccion qi que maximiza su beneficio indicado por la ecuacion (3.20). Eso nos da:
i (qi
=0
qi
a 2bqi + ci
ci = 0
2
qi =
a ci
2b
(3.21)
a + ci 2cj
.
4b
(3.22)
a 3ci + 2cj
,
8b
j (qi , qj ) =
(a + ci 2cj )2
.
16b
(3.23)
3.4
49
HH
Hr
r
HH
@
H f
e
c
HH
@d
i, r
Hi,Hr
@
@r
r
@
@ q
p
l
2
1
@
@m
@
@
4
10
@r
@r
r
r
2
3
1
4
10
0
5
4
Juegos secuenciales
50
j, b
c
@ d
@
@
@r
2
4
1
10
j, b
HH
H f
HH
i,Hr
H
@ q
p
@
@
@r
r
e
i, r
l
r
2
3
@m
@
@r
1
4
5
0
@ m
@
@
@r
2
3
1
4
i, b
p
r
10
0
@ q
@
@
@r
5
4
5
4
51
Definici
on 5 Un perfil de estrategias es un equilibrio perfecto en subjuegos de un juego secuencial G si es un equilibrio de Nash en cada subjuego de G.
Una vez que tenemos la definicion del equilibrio perfecto en subjuegos
puede parecer que esta no tiene mucha relacion con el principio de la induccion hacia atras. Recuerda que la induccion hacia atras consiste en salir
de los u
ltimos nodos del juego, buscar la mejor accion de los jugadores en esos
nodos, y dar un paso hacia atras, considerando que el juego esta solucionado
en las etapas posteriores.
Cogemos el juego de la Figura 3.8. Estudiamos este juego con el principio
de la induccion hacia atras. En el nodo , la mejor accion de i es l. Si ahora
cogemos el subjuego en el nodo (en la figura 3.11), podemos ver que el u
nico
equilibrio de Nash en este subjuego es tal que i elige la accion l. Por lo tanto,
si buscamos un equilibrio perfecto en subjuegos del juego de la Figura 3.8,
la estrategia de i debe ser tal que elige la accion l en el nodo . Del mismo
modo, la accion optima de i en el nodo es p, y p es el u
nico equilibrio de
Nash en el subjuego .
Ya hemos analizado la u
ltima etapa del juego. Podemos estudiar ahora
la pen
ultima etapa, donde j juega. Por el principio de la induccion hacia
atras, sabemos que si j juega la accion e en el nodo , el jugador i juega la
accion l. Entonces, j sabe que si elige la accion e en el nodo , su ganancia
es 3, y la de i es 2. Eso implica que para j, el juego es como si se acabara
justo despues de haber jugado e o f . Es decir, es como si el juego fuera el
juego de la Figura 3.13.
i, b
H
j,
r
@
c
@d
@
@r
r
2
4
a
1
10
HH
H
b
HH
H
HH
j,H
Hr
@ f
e
@
@
@r
r
2
3
10
0
Juegos secuenciales
52
1
10
@ b
@
@
@r
2
3
53
3.5 Ejemplos
Por lo tanto, si y sj deben ser tales que
si = (x, l, p)
sj = (y, e) ,
(3.24)
sj = (d, e) .
(3.26)
3.5
Ejemplos
En esta seccion vamos a ver dos ejemplos: el primero demuestra que el equilibrio perfecto en subjuegos puede llegar a resultados que no son satisfactorios.
El segundo es solo un ejercicio.
3.5.1
r 6
5
1
0
0
2
3
1
2
4
5
3
4
6
Juegos secuenciales
54
3.5.2
Un juego con m
as de un equilibrio perfecto en
subjuegos
55
3.5 Ejemplos
b
HH
HH
a
Hb
HH
H j,
j,
HH
Hr
r
HH
@
H f
e
c
d
HH
@
i, r
i, r
i, r
HH
@
@r
@
@
p q @@ r
l
k
1
@m
h @
@
@
@
10
@r
@r
@r
r
r
r
r
i,
3
4
1
5
0
1
2
3
1
4
5
0
5
1
2
3
(3.27)
Juegos secuenciales
56
(3.30)
(3.31)
Podemos ver que estos tres equilibrios no dan el mismo resultado. Con
E1 , i obtiene una ganancia de 2, con E2 , de 5, y con E3 , de 2.
Puede hacer algo el jugador i para obtener el equilibrio E2 ? No. Por
que? Porque para obtener E2 , i tiene que jugar (l, q) en . Pero si hace eso,
no tiene la garanta que j jugara f . Si i juega (l, q), j tiene que elegir entre
dos equilibrios, E2 y E3 . Para j, estos dos equilibrios son iguales en terminos
de ganancias. Si j elige e en lugar de f , llegamos a E3 . En este caso, i no
puede hacer nada para influir en el comportamiento de j. Para que este fuera
el caso tendramos que cambiar las ganancias de j cuando i juega q.
57
3.5 Ejemplos
b
HH
HH
a
Hb
HH
H j,
j,
HH
Hr
r
HH
@
H f
e
c
HH
@d
i, r
i, r
i, r
HH
@
@r
@
@
p q @@ r
l
k
1
@m
h @
@
@
@
10
@r
@r
@r
r
r
r
r
i,
3
4
1
5
0
1
2
3
1
4
5
5
1
2
0
4
(3.32)
(3.33)
(3.34)
Para los dos jugadores, las ganancias en E10 (2 para i y 3 para j) son mas
peque
nas que las ganancias en E20 (5 para i y 4 para j).
Juegos secuenciales
58
(3.35)
(3.36)
s2j = (c, f ),
s4j = (d, f ) .
(3.37)
Para ver si hay dominacion entre s1i y s2i , tenemos que comparar las ganancias
de i con estas dos estrategias y todas las estrategias de j. Tenemos:
ui (s1i , s1j ) = 2
ui (s2i , s1j ) = 2
(3.38)
ui (s1i , s2j )
ui (s1i , s3j )
ui (s1i , s4j )
ui (s2i , s2j )
ui (s2i , s3j )
ui (s2i , s4j )
=5
(3.39)
=2
(3.40)
=5
(3.41)
=5
=2
=5
59
3.6
a
j
r
c
r
@d
@
@r
2
2
0
0
HH
Hb
HH j
Hr
@ f
e
@
@
@r
r
0
0
1
1
a
b
c, e c, f
2, 2 2, 2
0, 0 1, 1
d, e d, f
0, 0 0, 0
0, 0 1, 1
Juegos secuenciales
60
a
b
2, 2 2, 2 0, 0 0, 0
0, 0 1, 1 0, 0 1, 1
61
que en cada nodo (uno despues que i juega a y el otro despues que i juega b),
j tiene dos acciones. Tener 2 acciones en cada nodo es la u
nica manera que
j tenga 4 estrategias. Porque las estrategias de j se llaman , , ... tenemos
que dar nombres a las acciones. Suponemos que w, x, y, z sean estas acciones
y obtenemos el juego siguiente:
w
r
ib
HH
HHb
a
H
j
HHjr
r
@
@
y
@x
@z
@
@
@r
@r
r
= (w, z) .
(3.43)
Juegos secuenciales
62
w
r
1
1
ib
HH
H b
a
HH
j
HHjr
r
@
@
y
@x
@z
@
@
@r
r
@r
2
2
0
0
0
0
w
r
1
1
ib
H
HH
a
Hb
HH j
j
Hr
r
@
@
y
@x
@z
@
@
@r
@r
r
0
0
2
2
0
0
2, 2 3, 1
0, 0 1, 1
63
r
@
@
@
@r
HH
HH
b
j
r
@
@
@
@r
HH
Ha
HH
H
Juegos secuenciales
64
peque
no juego en forma normal, pero en la seccion siguiente veremos que s,
es posible. Para ello, tenemos que introducir un nuevo concepto, el de la
informacion imperfecta.
3.7
Informaci
on imperfecta
65
3.7 Informaci
on imperfecta
ib
HH
H hablar
callarse
HH
f
j
g
rp p p p p p p p p p p p p p p p p p p p p p H
p H
p p r
@
@
callarse
callarse
@hablar
@hablar
@
@
r
@r
@r
r
1
1
5
0
0
5
2
2
Juegos secuenciales
66
hablar
callarse
hablar
2, 2
5, 0
callarse
0, 5
1, 1
5
0
0
5
2
2
67
3.7 Informaci
on imperfecta
Cruise
r
2
1
ib
HH
H O.T.
Cruise
HH
f
j
g
rp p p p p p p p p p p p p p p p p p p p p p H
p H
p p r
@
@
Cruise
@O.T
@O.T
@
@
r
@r
@r
0
0
0
0
1
2
Cruise
r
2
1
ib
HH
HHO.T.
Cruise
H
f
HHgr
r
@
@
Cruise
@O.T
@O.T
@
@
@r
@r
r
0
0
0
0
1
2
Juegos secuenciales
68
Captulo 4
Juegos repetidos
Los juegos repetidos, al igual que los juegos secuenciales, son juegos dinamicos.
En un juego repetido los jugadores repiten T veces un mismo juego G, donde
G puede ser un juego en forma normal o extensiva. El hecho de jugar una
vez el juego G se llama una etapa y, por lo tanto, un juego G repetido T
veces tiene T etapas. La mayor diferencia con los juegos secuenciales es que
en un juego repetido en T etapas los jugadores reciben despues cada etapa
la ganancia obtenida en dicha etapa, mientras que en un juego secuencial los
jugadores reciben la ganancia obtenida al final del juego.
En la teora de juegos repetidos diferenciamos entre los juegos repetidos
finitamente, T es finito, y los juegos repetidos infinitamente, T = . En
este captulo veremos los dos casos.
4.1
Juegos repetidos
70
T
X
ui (st ) .
(4.2)
t=1
La definicion de un juego GT que acabamos de ver implica que los jugadores ven los T juegos G como juegos independientes, es decir, un jugador
puede decidir de jugar una estrategia si de G en una etapa y jugar otra
estrategia en otra etapa.
4.1.1
Hablar
Callarse
Hablar
2, 2
5, 0
Callarse
0, 5
1, 1
(4.3)
71
H, H
4, 4
7, 2
7, 2
10, 0
H, C
2, 7
3, 3
5, 5
6, 1
C, H
2, 7
5, 5
3, 3
6, 1
C, C
0, 10
1, 6
1, 6
2, 2
4.1.2
Los juegos con dos jugadores y con suma cero fueron los primeros juegos
analizados en la historia de los juegos. En estos juegos la ganancia de un
jugador es siempre la ganancia del otro jugador multiplicado por 1. Una
definicion exacta es la siguiente:
Definici
on 6 Un juego G = {N = i, j, Si , Sj , ui , uj } es un juego con suma
cero si para cualquier perfil de estrategia si Si , sj Sj tenemos:
ui (si , sj ) = uj (si , sj ) .
(4.4)
Juegos repetidos
72
a
b
c
d
0, 0 2, 2
6, 6 5, 5
sj Sj
sj Sj
(4.5)
(4.6)
(4.7)
73
Proposici
on 3 Sea G un juego con suma cero y con dos jugadores, i y j.
Si (si , sj ) es un equilibrio de Nash, entonces
ui (si , sj ) = max
ti (Si ) tj (Sj )
max ui (ti , tj ) .
tj (Sj ) ti (Si )
(4.8)
Aqu, (Si ) es el conjunto de las estrategias mixtas del jugador i. Tenemos que utilizar el conjunto (Si ) en lugar del conjunto Si por que el
equilibrio de Nash puede ser un equilibrio en estrategias mixtas.
Por supuesto, tenemos tambien un equivalente de la ecuacion (4.8) con el
jugador j:
uj (si , sj ) = max
tj (Sj ) ti (Si )
max ui (ti , tj ) .
ti (Si ) tj (Sj )
(4.9)
4.1.3
El min-max
c
2, 4
4, 1
d
0, 3
10, 2
sj Sj si Si
(4.10)
Juegos repetidos
74
La ecuacion 4.10 se lee as: Cogemos primero una estrategia sj , y buscamos la estrategia si que maximiza la ganancia de i, ui (si , sj ). Repetimos
eso con todas las otras estrategias del jugador j. En el juego, si cogemos la
estrategia c, la estrategia que maximiza la ganancia del jugador i es b. Con
el perfil de estrategias (b, c), el jugador i tiene una ganancia de 4. Con la
estrategia d, la estrategia de i que maximiza la ganancia de i es b, que le da
una ganancia de 10.
Ahora, el jugador j tiene que elegir una estrategia, pero sin maximizar
su ganancia: va a elegir la ganancia que minimiza la ganancia de i. Si j
juega c, la mejor ganancia que i puede tener es 4, y si j juega d, la mejor
ganancia de i es 10. As pues, j va elegir la estrategia c.
La ganancia del jugador i con el principio del min-max en nuestro juego
es 4.
Hemos buscado la ganancia de i con el principio del min-max, pero podemos tambien utilizar el principio del max-min:
max min ui (si , sj ) .
si Si sj Sj
(4.11)
La u
nica diferencia es en el orden de la b
usqueda de las estrategias de los
jugadores i y j. En la ecuacion 4.11, cogemos primero una estrategia de i,
y buscamos la estrategia de j que minimiza la ganancia de i. Hacemos lo
mismo con las otras estrategias de i, y al final el jugador i elige la estrategia
i que maximiza su ganancia.
En el juego, si i juega a, la estrategia de j que minimiza la ganancia de
i es d. En este caso, i tiene una ganancia de 0. Si i juega b, la estrategia de
j que minimiza la ganancia de i es c. En este caso, i tiene una ganancia de
4. Entonces, la estrategia de i que maximiza su ganancia cuando j quiere
minimizar la ganancia de i es c.
As pues, la ganancia del jugador i con el principio del max-min es 4, que
es la misma cuando utilizamos el principio del min-max. Esta ganancia se
escribe vi .
Siempre es el caso que el valor de vi cuando utilizamos el principio del
max-min es igual que el valor vi cuando utilizamos el principio del min-max,
es decir:
max min ui (si , sj ) = vi min max ui (si , sj ) . .
si Si sj Sj
sj Sj si Si
hablar
2, 2
5, 0
callarse
0, 5
1, 1
(4.12)
75
Juegos repetidos
76
a
b
c
d
0, 1 2, 0
4, 4 3, 5
c
d
2, 5 3, 1
2, 0 5, 3
Figura 4.5:
Es facil de ver que el valor del jugador i con el min-max es lo mismo que
con el max-min: vi = 2, y eso esta obtenido con el perfil (a, c). El valor de
j con el principio del max-min es vj = 3, y con el principio del min-max
es vj = 1. Parece entonces que tenemos un ejemplo donde no tenemos la
igualdad entre el max-min y el min-max. La razon es que no hemos hecho
un analisis correcto.
Lo que podemos hacer para analizar el max-min (o el min-max) de un
jugador es de borrar las ganancias del otro jugador. Si queremos buscar el
valor del jugador j solo miramos a las ganancias de j. As, tenemos el juego
siguiente:
2
77
a
b
c
5
0
d
1
3
a
b
c
d
5, 5 1, 1
0, 0 3, 3
Figura 4.7: Un juego con suma cero relacionado con el juego de la Figura 4.5
Por cierto, si buscamos el valor de j en el juego de la Figura 4.7 debemos
que encontrar el mismo resultado que con el juego de la Figura 4.5.
Pero hemos visto en la seccion 4.1.2 que en los juegos con suma cero la
propiedad max min = min max esta muy relacionada con el equilibrio
de Nash del juego: tenemos esta igualdad cuando tenemos un equilibrio de
Nash. Si buscamos el max-min o el min-max de las ganancias de la Figura 4.6
con las estrategias puras, entonces tenemos que buscar tambien el equilibrio
de Nash del juego de la Figura 4.7 con las estrategias puras.
Pero podemos ver que en el juego de la Figura 4.7 no existe equilibrio
de Nash en estrategias puras. Entonces, es normal si encontramos que el
max-min es distinto del min-max.
Si utilizamos las estrategias mixtas entonces vamos a encontrar un equilibrio de Nash. Con la proposicion 3 en la pagina 73 podemos deducir que
la ganancia de j en el equilibrio de Nash es su valor con el principio del
min-max (y del max-min).
4.1.4
Ahora que hemos visto el principio del max-min podemos introducir un resultado nuevo:
Proposici
on 4 Sea G un juego en el que todos los equilibrios de Nash las
ganancias de los jugadores son identicas a las ganancias con el principio del
min-max, es decir, para cada jugador i, en todos los equilibrios de Nash la
ganancia de i es vi . Para cualquier valor T , si (s1 , . . . , sT ) es un equilibrio
del juego GT , cada perfil de estrategias st es un equilibrio de G.
Interpretaci
on de la proposici
on
Juegos repetidos
78
4.1.5
O.T.
Cruise
O.T.
2, 1
0, 0
Cruise
0, 0
1, 2
79
O.T., O.T.
O.T., C
C, O.T.
C, C
O.T., O.T.
4, 2
2, 1
2, 1
0, 0
O.T., C
2, 1
3, 3
0, 0
1, 2
C, O.T.
2, 1
0, 0
3, 3
1, 2
C, C
0, 0
1, 2
1, 2
2, 4
4.1.6
El equilibrio de Nash
(4.13)
Juegos repetidos
80
(4.14)
T
donde uG
i (s) es la ganancia de i en el juego G cuando los jugadores juegan
el perfil s:
T
X
GT
ui (s) =
ui (st ) .
(4.15)
t=1
(4.16)
t=1
ui (s ) +
ui (
si , sTi )
>
T 1
X
(4.18)
t=1
81
T 1
X
ui (st ) + ui (s0i , si ) .
(4.19)
t=1
(4.20)
a
b
c
d
9, 0
1, 1
0, 5 0, 5
Figura 4.10:
Juegos repetidos
a, a
a, b
b, a
b, b
82
c, c
c, d
d, c
d, d
18, 0
10, 1
10, 1
2, 2
9, 5 9, 5 1, 4 1, 4
9, 5 1, 4 9, 5 1, 4
0, 10 0, 10 0, 10 0, 10
83
b
PPP
PP
a
b
PP
PP
PP
j
rpHp p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p pPp P
p pr
H d
HH d
c
c
HH
HH
HHir
HHir
ir
ir
@
@
@
@
a
a
a
a
@b
@b
@b
@b
j
j
j
j
@
@
@
rp p p p p p p p p p p @
pr p p p p p p p p p p @
p rp
p rp
pr p p p p p p p p p p @
p rp
pr p p p p p p p p p @
p@
p rp
D
A
A
D
D
D
D
D
c Ad
c Ad
D
D
D
D
D
D
AAr c D d
AAr
c Dd
c Dd
c Dd
c Dd
c D d r
r
D
D
D
D
D
D
D
D
D 10
D
D
0
0 D
1
D
D
D
D
D 1
D
10 10
4
Dr
Dr
Dr
Dr
Dr
Dr
r
r
r
r
r
r
18
10
0
1
9
5
9
5
1
1
4 4
9
1
5 4
9
5
1
4
0
0
10 10
4.1.7
Juegos repetidos
84
4.2
4.2.1
Los juegos repetidos infinitamente siguen el mismo principio que los juegos
repetidos finitamente. Sin embargo, tenemos que modificar el calculo de las
ganancias. En los juegos repetidos finitamente la ganancia de un jugador es la
suma de sus ganancias en cada etapa. Si seguimos este principio no podemos
comparar las ganancias de un jugador en los juegos repetidos infinitamente.
c
2, 2
1, 3
a
b
d
1, 1
4, 5
Figura 4.13:
Supongamos que el juego de la Figura 4.13 esta repetido infinitamente y
que el jugador j siempre elige la estrategia c.
Para el jugador i jugar siempre la estrategia c parece mejor que jugar
siempre la estrategia b. Si hacemos la suma de las ganancias en cada etapa
tenemos para la estrategia a:
X
t=1
ui (a, c) = + .
(4.21)
85
ui (b, c) = + .
(4.22)
t=1
(4.23)
uG
(s)
i
t1 ui (st ) .
(4.24)
t=1
uG
(s) =
i
4.2.2
u
.
1
(4.25)
Ganancia media
X
t=1
t1 ui (st ) ,
(4.26)
Juegos repetidos
86
t1 u =
t=1
u
.
1
(4.27)
(4.28)
El concepto de la ganancia media resulta ser muy practico para el estudio de los juegos repetido infinitamente. Consideramos ahora un perfil de
estrategias, s , en un juego G repetido infinitamente muy complicado (por
ejemplo, en cada etapa los jugadores cambian de estrategias). Supongamos
que con el perfil el s el jugador i gana V .
Supongamos ahora que podemos encontrar un perfil s muy sencillo en el
juego G con el que el jugador i gana V (1 ). Entonces, para el jugador
i jugar el perfil de estrategias s jugar siempre el perfil s es igual. La
ganancia del jugador i con el perfil s es la misma que la ganancia con el
perfil (
s, s, s, . . . ).
Ya sabemos que si V es la ganancia de un jugador en un juego repetido
infinitamente, entonces, su ganancia media es V (1 ). Podemos tambien
hacer el camino reves: si un jugador tiene como ganancia media V (1 ),
entonces, su ganancia total sera V . Si un jugador gana en cada etapa V (1)
su ganancia total es:
X
t1 (V (1 ))
(4.29)
t=1
4.2.3
1
=V .
1
(4.30)
Ganancia factible
87
a
b
c
3, 2
1, 6
d
1, 1
0, 5
Figura 4.14:
El jugador j juega la estrategia c
El jugador i juega la estrategia a con una probabilidad
b con una probabilidad 21 .
1
2
y la estrategia
4.2.4
Equilibrio de Nash
En la seccion anterior Con los juegos repetidos finitamente hemos visto que
en general las estrategias jugadas en los equilibrios de Nash de un juego GT
son muy parecidas a las estrategias jugadas en los equilibrios de Nash del
juego G.
Con los juegos repetidos infinitamente los resultados cambian mucho, y
vamos a ver que podemos tener equilibrios de Nash en un juego G repetido
infinitamente en los que los jugadores no juegan en ninguna etapa estrategias que forman un equilibrio de Nash del juego G. Por ejemplo, en el
dilema de los prisioneros el u
nico equilibrio de Nash es cuando los dos jugadores se callan. No se puede alcanzar como equilibrio de Nash el perfil
(Hablar,Hablar). Si repetimos el dilema de los prisioneros un n
umero finito
de veces, tambien hemos visto que en el u
nico equilibrio de Nash los jugadores
juegan en cada etapa el perfil (Callarse,Callarse) como en el juego repetido
Juegos repetidos
88
una vez. Si cogemos el dilema de los prisioneros repetido infinitamente vamos a ver que podemos obtener un equilibrio de Nash en el que los jugadores
juegan (Hablar,Hablar) en cada etapa. Esto es una aplicacion directa del
teorema del pueblo: :
Teorema 2 Sea G el juego G repetido infinitamente con un factor de descuento . Sean vi y vj los valores de los jugadores i y j con el principio del
max-min. Si (Ui , Uj ) es una ganancia factible en G con la que:
Ui
vi
1
Uj
vj
1
H
C
H
C
2, 2 0, 5
5, 0 1, 1
(4.31)
(4.32)
Eso significa que las ganancias (10; 10) son factibles en el juego repetido infinitamente: hemos encontrado un perfil de estrategias con el que la ganancia
de cada jugador es 10.
El teorema dice que es posible entonces de tener un equilibrio de Nash en
el que los jugadores ganan 10 cada uno, por ejemplo jugando (Hablar,Hablar)
89
4.2.5
Ejemplo
a
b
c
d
2, 2 0, 3
4, 6 1, 5
Juegos repetidos
90
que repetimos un n
umero infinito de veces con un factor de descuento = 0, 8.
Podemos encontrar un equilibrio de Nash del juego repetido infinita
mente en el que los jugadores i y j ganan respectivamente uG
= 20 y
i
G
ui = 30?
Primero tenemos que calcular los valores de i y j:
El valor del jugador i con el principio del max-min es vi = 1 y corresponde
al perfil de estrategias (b, d) y el valor de j es vj = 3 y esta obtenido con el
perfil (a, d).
Entonces, tenemos
vi
1
=
=5
1
0, 2
3
vj
=
= 15
1
0, 2
Entonces, tenemos
vi
1
vj
= 30 >
1
uG
= 20 >
i
uG
j
(4.33)
(4.34)
91
Indice
Amenaza, 46
Juegos repetidos (en los), 89
Factor de descuento , 85
Ganancia
Esperada, 20
Factible, 86
Media, 85
Camino de ejecucion, 44
Desviar, 13
Dilema de los prisioneros
Forma extensiva, 64
Forma normal, 30, 66
Historia, 64
Duopolio
de Cournot, 34
de Stackelberg, 47
Juego
Batalla de los sexos
Forma extensiva, 67
Forma normal, 30
Ciempies, 53
Con suma cero, 71
Dilema de los prisioneros
Forma extensiva, 64
Forma normal, 30, 66
Historia, 64
Monedas (de las), 33
Repetido finitamente
Forma extensiva, 82
Equilibrio
de Nash, 12, 13, 42
Juegos repetido finitamente (en
los), 77, 80
Juegos repetido infinitamente
(en los), 88
Perfecto en subjuegos, 48, 51
Juegos repetido finitamente (en
los), 84
Estrategia
Dominada
Estrictamente, 10
No estrictamente, 11
Dominante, 12
Mixta, 18
Soporte, 21
Pura, 18
max-min, 72
Mejor respuesta, 13
min-max, 72
Soporte
De una estrategia mixta, 21
Subjuego, 48
Teorema
de Nash, 20
del pueblo, 88