Académique Documents
Professionnel Documents
Culture Documents
UFG-Editores
Primera edicin
2014
658.8
C921t
Crespn Elas, Elner Osan, 1968Teora de juego y estratega / Elner Crespn Elas. -- 1 ed. --
sv
ISBN 978-99923-47-49-2
Derechos reservados
Copyright
Segn la Ley de Propiedad Intelectual
UFG-Editores
UNIVERSIDAD FRANCISCO GAVIDIA
Calle El Progreso N 2748, Col Flor Blanca.
San Salvador, El Salvador Centroamrica.
Tel.: (503) 2249-2716
Correo electrnico: investigacion@ufg.edu.sv
Sitio web: www.ufg.edu.sv
Tabla de contenido
Introduccin................................................................................................................................................................................ 1
I. Tipos de juegos...................................................................................................................................................................... 3
1.1. Dilema de una empresa nica en un mercado proteccionista.......................................................................................
II El Equilibrio de Nash...................................................................................................................................................................... 15
2.1 Ejercicios y aplicaciones.................................................................................................................................................................. 17
43
48
55
Bibliografa.................................................................................................................................................................................................. 83
Glosario.......................................................................................................................................................................................................... 85
Introduccin
La Teora de Juegos es una rama de la
empresas es importante.
en
el
comportamiento
comn:
el
otros jugadores).
pueden
analizarse
ignorando
es un comportamiento estratgico.
I
Tipos de juegos
mercado proteccionista1
Supuestos:
1. La ciudad se extiende a lo largo de
una avenida.
Tiendas).
6. Los consumidores potenciales compran
! YLYHQ D XQD GLVWDQFLD G GH
Dinmico
una tienda).
Informacin
Informacin
completa
incompleta
Equilibrio de
Equilibrio
Nash
Bayesiano de
Nash
ubicarlas?.
Equilibrio de
Equilibrio
Nash perfecto
Bayesiano
en subjuegos
Perfecto
7.
6HREWLHQHQYHQWDVYHQWDV
Qu
otras
situaciones
implican
un
le compraran a la
al punto b.
de la Empresa 1.
pequeo).
Entonces
la
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Empresa 1.
Se
b)
Ahora,
tambin
la
alternativa
de
puede
ubicar
examinar
2
tiendas.
consideran
juegos
simples
con
las
simultneamente2;
reciben
sus
Cunto mercado
captar la Empresa 2?
puede ganar
puede ganar
, se llevar la demanda
; vender
de la demanda.
Piedra
Papel
Tijera
Piedra
0,0
-1,1
1, -1
Papel
1, -1
0,0
-1,1
Tijera
-1,1
1, -1
0,0
en un tiro de penalti?
Portero
Delantero
Izquierda
Derecha
Izquierda
-1,1
1, -1
Derecha
1, -1
-1,1
1=x;
Jugador
2=y.
Cul
es
el
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
al prisionero 1?
de pagos:
Preso 2
Preso 1
No Confesar
Confesar
No Confesar
-1,-1
-9,0
Confesar
0,-9
-6,-6
suponemos
slo de 2.
que
si
los
dos
hacen
elegir
una
poltica
comercial
en
que
ambos
eran liberales (y el
para
aumentar
su
propio
pierden
competitividad
Definicin 1.0:
La representacin en forma normal de un
juego con n jugadores especifica los espacios
de estrategias de los jugadores S1,.,Sn y sus
funciones de ganancias u1,,un. Se denota el
juego con G={S1,.,Sn;u1,,un}.
La eleccin de estrategias en forma simultnea
implica que cada parte elija la accin a seguir sin
conocer las decisiones de los dems (como sera
el caso si los presos tomasen una decisin en
momentos arbitrarios en sus celdas separadas).
siguiente forma:
i.
El
conjunto
de
jugadores
est
Pueden
haber
jugadores,
{1,,n},
un
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
cada jugador.
=0
u1 (Confesar, Confesar)
=-6
=-9
=0
=-6
=-9
Definicin 2.0:
En el juego en forma normal G = {S1,.,Sn;
u1,,un}, sean s i y s i posibles estrategias del
jugador i (s i y s i son elementos de Si). La
estrategia s i
utilizar s i:
juego siguiente:
Figura 1.4
Jugador 2
Jugador 1
Izquierda
Centro
Alta
1,0
1,2
Baja
0,3
0,1
no confesar).
En la figura 1.4, baja est ahora estrictamente
Figura 1.3
Jugador 2
Jugador 1
Derecha
1,2
0,1
0,1
2,0
Izquierda
Centro
Alta
1,0
Baja
0,3
Figura 1.5
Jugador 2
Jugador 1
Alta
Izquierda
Centro
1,0
1,2
10
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
estrategias
estrictamente
hE/sZ^/&ZE/^K's//h&'
dominadas,
el
Figura 1.6
A
de
0,4
4,0
5,3
4,0
0,4
5,3
3,5
3,5
6,6
Ilopango
tiene
flotas
pesqueras
11
N={1, 2}.
Ai = {Cine, Teatro}. Cada jugador selecciona una
accin que puede ser ir al cine o ir al teatro.
El Jugador 1 prefiere ver una pelcula con el
Jugador 2 que ir al teatro.
Teatro
Pelcula
a,b
0,0
Teatro
0,0
c,d
b)
a>d, b<c
c)
a>c, b<d
d)
a<c, b<d
Jugador 1 / Jugador 2
a>c, b>d
a)
Norte
Sur
Norte
2, -2
2.1, -2.1
Sur
1.1, -1.1
3, -3
12
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
i. Radio. (baja).
presenta a continuacin:
Empresa 2
Empresa 1
Baja
Media
Alta
Baja
70, 70
65, 80
50, 90
Media
80, 60
60, 65
40, 60
Alta
60, 50
40, 40
20, 45
dominante?
Aplicar el proceso de EIEED. Cul es la
Jugador 2
9 mil
10 mil
7 mil
7, 7
14, 0
14, 0
14, 0
8 mil
0, 14
8, 8
15, 1
15, 1
9 mil
0, 14
1, 15
9, 9
16, 2
10 mil
0, 14
1, 15
2, 16
10, 10
del Viajero).
jugadores
8 mil
Jugador 1
Dos
7 mil
eligen
de EIEED?
simultneamente
7.
Empresa 2
Empresa 1
Izquierda
Derecha
Baja
4, 2
1, 4
Media
2, 4
3, 1
Alta
1, 3
4, 4
13
II
El Equilibrio de Nash
Definicin 3.0:
ui(s*1,.,s*i-1, si ,s*i+1,,s*n)
Figura 2.1
Jugador Columna
es una solucin de
max ui (s*1,,s*i-1,si,s*i+1,,s*n)
si Si
0, 4
4, 0
5, 3
4, 0
0, 4
5, 3
3, 5
3, 5
6, 6
Jugador
Fila
junta en la pera.
de estos juegos.
de
dominadas
las
estrategias
(EIEED)?
estrictamente
Recordemos
que
las
Mara
pera
Boxeo
pera
2, 1
0, 0
Boxeo
0, 0
1, 2
de ningn EN.
Nash existe? 8
16
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Piedra,
papel, tijera?
Papel
Tijera
Piedra
0,0
-1,1
1, -1
Papel
1, -1
0,0
-1,1
Tijera
-1,1
1, -1
0,0
PB = 0.7 tenemos:
Todos los votantes cuyos niveles ideales
Entonces:
A tiene el 15% + 40% = 55% de los votos, y
17
es 1, y B pierde y su ganancia es 1.
de los votantes.
y supone
que PB =
(PA PB))
tenemos que
el (PA+
es cuando PA =
Dado que PB =
(PA +
, y que PA <
, tenemos que:
y PB =
y supone que PB = .
8. Qu es un juego en forma normal?, Qu
es una estrategia estrictamente dominada
en un juego en forma normal?, Qu es
9 Se puede hacer el mismo anlisis para el candidato B.
18
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Empresa B
Empresa A
30, 30
50, 1
40, 60
20, 20
J2
J1
2, 0
1, 1
4, 2
3, 4
1, 2
2, 3
1, 3
0, 2
3, 0
6, 6
8, 20
0, 8
10, 0
5, 5
2, 8
8, 0
20, 0
4, 4
2, 3
4, 5
1, -1
1, 4
2, 3
1, 5
1, 0
0, 1
3, 3
Piedra
Papel
Tijera
Piedra
0, 0
-1, 1
1, -1
Papel
1, -1
0, 0
-1, 1
Tijera
-1, 1
1, -1
0, 0
19
III
Estrategias mixtas
Jugador 1
Cara
Cruz
Cara
-1, 1
1, -1
Cruz
1, -1
-1, 1
N = {Jugador 1, Jugador 2 }
S1 = S2 = { Cara, Cruz }
(Harsany, 1973).
(acciones
mixtas,
que
asignan
distintas
Jugador 1
S1 = { A, B, C }
3, 2
1, 4
1, 3
2, 1
2, 2
2, 0
Estrategias Puras
S2 = { I, D }
probabilidad de elegir A
probabilidad de elegir C
1 p q
1).
probabilidad de elegir B
probabilidad de elegir I
En el siguiente juego podramos utilizar diferentes
probabilidad de elegir D
1 r
estrategias mixtas:
Figura 3.2
), que asigna
a C, y una probabilidad de
a B.
22
J2
a A, una probabilidad
Izquierda
J1
Centro
Derecha
Arriba
1, 0
1, 2
0, 1
Abajo
0, 3
0, 1
2, 0
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
de probabilidad (q, r, 1 q r)
1 q r
q+r
);(
) M (si q
), pero nunca B.
,0 ).
) y al
), respecto a
utilizar a B.
Definicin 4.0:
En el juego en forma normal G = {S1,,Sn; u1,,un}
supongamos que el jugador i cuenta con k
estrategias puras Si = {si1,,sik }. En este caso
Pik
el J2 utiliza I.
Entonces J1 gana:
Figura 3.3
3
J2
J1
combinacin S1 = (A,I) ).
3,
0,
0,
3,
combinacin S2 = (M,I) ).
1,
1,
S1 = { A, M, C } S2 = { I, D }
(con la
(con la
23
es mayor que
de B.
Mientras el J2:
Figura 3.4
J1
3,
0,
0,
3,
2,
2,
Figura 3.5
J2
J1
4, 1
-1, 1
2, -4
-2, 1
Si el J2 utiliza la estrategia C
J1 gana:
4 con una probabilidad de (con el perfil (A, C).
2 con una probabilidad de (con el perfil (B, C).
y el J2 gana:
24
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
q x (-1) + (1 - q) x (1) = -q + 1- q = 1- 2q
; (q, 1 q) =
J1
4, -5
4, 8
1, 4
0, 1
), la
, y Cruz si q >
25
Definicin 5:
J2
J1
(q) Cara
(1-q) Cruz
(r) Cara
-1, 1
1, -1
(1-r) Cruz
1, -1
-1, 1
rq(-1)+r(1-q)(1)+(1-r)(q)(1)+(1-r)(1-q)(-1)
=(2q-1)+r(2-4q)
Donde:
rq
V2 (p*1, p*2)
r (1-q)
(1-r)(q)
yr=
0 (cruz) si q> .
Solucin:
La idea consiste en dotar el jugador j de una
cierta informacin privada de manera que,
dependiendo de cmo el jugador j entienda
de r cuando q=
, el
es tambin indiferente
plano p-q).
Mara
26
(q) pera
(1-q) Boxeo
(r) pera
2, 1
0, 0
(1-r) Boxeo
0, 0
1, 2
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
de Nash.
Estos resultados pueden graficarse as:
(q = 0, r = 0), (q = 1, r = 1) y (q = , r = ).
q= .
As,
si q > la mejor respuesta de Mara es pera (r = 1)
si q < la mejor respuesta de Mara es Boxeo (r = 0), y
si q = cualquier valor de r es una mejor respuesta.
al elegir pera , y
al elegir Boxeo
juegos 2x2
Se complica encontrar EN cuando tenemos
r = . As,
27
J2
(q) Cara
(1-q) Cruz
(p) Cara
1, -1
-1, 1
(1-p) Cruz
-1, 1
1, -1
representacin grfica).
1) Dados (p,1-p) y (q,1-q) EM genricas para J1 y
J2, respectivamente.
Pasos:
1. Se fijan EM genricas para los jugadores.
Sean (p,1-p) y (q,1-q) EM genricas para los
jugadores 1 y 2 respectivamente.
la estrategia de J1 es (p,1-p).
2 q-1< 1 -2q
el
plano
p-q
se
representan
q< .
J2, R 2(p).
6. En
q> .
q= .
Cruz si q <
Cualquiera si q =
R1(q)
P = 0 (cruz) si q <
P = 1 (cara) si q >
28
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
las
J2 juega su EM (q,1-q)= , ).
ptima R 2(p)
1-2p> 2p-1
p< .
p> .
Cara, si p < ,
Cruz si p >
Cualquiera si p =
R 2(p)
q = 1 (cruz) si p <
q = 0 (cara) si p >
desviarse unilateralmente.
Solucin:
.
J2
J1
(q) Cine
(1-q) Ftbol
(p) Cine
1, 2
0, 0
(1-p) Ftbol
0, 0
2, 1
El juego tiene 2 EN en EP
(cine, cine), (ftbol, ftbol).
29
q = 1 (cine) si p > .
R 2(p)
q [0,1]
q = 0 (ftbol) si p < .
Ei si p = .
El EN es la interseccin de la correspondencia
de respuesta ptima.
q = 2 -2q si y solo si q =
p = 0 (ftbol) si q < .
p [0,1]
Ei si q = .
Jugador 1
8, 1
0, 2
4, 0
3, 3
1, 2
0, 0
5, 0
2, 3
8, 1
con probabilidad
30
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
{U, M, D} donde
2, 1
0, 0
0, 0
1, 2
es la
es la probabilidad que el J1
como (
(U),
(M),
(D)) y en forma
Jugador 2
10, 0
0, 10
3, 3
2, 10
10, 2
6, 4
3, 3
4, 6
6, 6
2, 0
1, 1
4, 2
3, 4
1, 2
2, 3
1, 3
0, 2
3, 0
5. Qu es un NE con EM en un juego en
forma normal? Qu es un EM en un juego
a) u1 (U , C)
en forma normal?
b) u2 (D , R)
c) u2 (D , C)
d) u1 (
,C) para
= ( , , 0)
e) u1 (
, R) para
= ( , , ,)
f) u1 (
, L) para
= ( 0,1,0 )
g) u2 (
,R) para
= ( , , 0)
h) u2 (
) para
siguientes juegos:
Prisionero 2
Prisionero
= ( , , 0) ; = ( , , )
) para
=( , ) y
=( , )
1, -1
-1, 1
-1, 1
1, -1
2, 2
0, 3
3, 0
1, 1
NC
NC
1, -1
-9, 0
0, -9
-6, -6
Jugador 2
) y u2(
Jugador 1
1, 0
1, 2
0, 1
0, 3
0, 1
2, 0
Jugador 2
Jugador 1
0, 4
4, 0
5, 3
4, 0
0, 4
5, 3
3, 5
3, 5
6,6
31
9. En el juego siguiente:
7, 7
8, 0
0, 8
9, 9
=( , ). Cul es el
b. Si el jugador 1 cree
de jugar L.
siguiente juego:
a. u1 (
, I) para
=( , , , )
b. u2 (
, O) para
=( , , , )
c. u1 (
) para
= ( , , , ),
=( , )
d. u1 (
) para
= ( O, , , ),
=( , )
2, 1
0, 1
0, 4
2, 3
OA
2, 2
2, 2
OB
2, 2
2, 2
IA
4, 2
1, 3
IB
3, 4
1, 3
32
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Japn
Abierto
EU
Cerrado
Abierto
10, 10
5, 5
Cerrado
-100, 5
1, 1
Solucin:
Estratega dominante
) y el Jugador 2
EU
al
siempre
margen
elegir
de
lo
Jugador 2
Jugador 1
abrir
que
su
decida
4, -5
4, 8
1, 4
0, 1
mercado
Japn.
Mara
pera
Boxeo
pera
2, 1
0, 0
Boxeo
0, 0
1, 2
de utilidades.
33
Jugador 2
Jugador 1
2, 3
2, 1
1, -1
4, 3
Jugador 2
Jugador 1
-2, -2
-2, 1
0, 0
-2, 1
1, -2
0, 0
0, 0
0, 0
1, 1
2, 4
2, 5
2, 0
7, 1
6, 5
1, 2
5, 6
3, 0
se enteren.
cada uno.
Jugador 2
H
ambos
elegirn
simultneamente
Jugador 1
0, 0
0, -c
-c, 0
1-c, 1-c
T= trabajar H= holgazanear
34
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
actividades irregulares.
conciencia
dedicarse
actividades
actividades
irregulares
lo
despediran
tiene
solo
estrategias
posibles.
35
lanzarse a la izquierda?
si
(1-q)?
actividades irregulares.
f.
manera:
Supervisar,
Jefe
Empleado
(q)
Supervisar
(S)
(1-q) No
supervisar
(NS)
(p) Trabajar
(T)
w, 20-w-4
w, 20-w
(1-p) Otras
Actividades
(OA)
0, 6
w+6, 10-w
pues
si
se
tuviera,
el
36
As
el
nico
equilibrio
es
en
EM.
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
se requiere que:
P(20-W-4)+(1-p)(6) = P(20-W)+(1-p)(10-W)
20P-PW-4p+6 -6P = 20P-PW+10-W-10P+PW
6 + 10P = 10P + P W + 10-W
6-10 = W(P-1)
(1-P) =
Pero q =
siguiente:
T:
T:T
T:T
T:T
supervisar.
Con salarios ms altos desaparece este
qW
Portero
de forma siguiente:
(p-1) W 4
(1-p)W
Es el ahorro de supervisar.
Es el costo de supervisar.
Delantero
Izquierda
Derecha
Izquierda
Derecho
-1, 1
1, -1
1, -1
-1, 1
37
al lado derecho.
Portero
voluntariamente.
c. Si lanza un dado, equivale a utilizar
Delantero
al lado izquierdo y
(q)
Izquierda
(1-q)
Derecho
(p) Izquierda
-1, 1
1, -1
(1-p) Derecha
1, -1
-1, 1
al
lado derecho.
uD = pq(-1)+p(1-q)(1) + (1-p)(q)(1) + (1-p)(1-q)(-1)
al lado
al lado
derecho.
f.
al delantero le
meter el gol y
(y a la
La uD = ( ) (-1) + ( ) (1) = ( )
La up = ( ) (1) + ( ) (-1) = - ( )
up = ( )(-1) + ( )(1) =
Si el portero eligiera una EM con una probabilidad
de q de tirarse a la izquierda, una probabilidad de
38
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
en lugar de
).
P-1+ p = -P +1-p
4p = 2
p=
-4q = -2
q=
dos estrategias.
As, el nico equilibrio en estrategias mixtas
g. As deber cumplirse:
39
IV
Juegos de suma cero (n =2)
es reduciendo el de su rival.
s1 en S1, s2 en S2
Gerente 2
J2
J1
Izquierda
Derecha
Arriba
70, -70
50, -50
Abajo
80, -80
40, -40
J2
J1
Izquierda
Derecha
Arriba
70
50
Abajo
80
40
Gerente 1
Mantener
T1
T2
Mantener
50, 50
40, 60
T1
20, 80
30, 70
50, 50
T2
70, 30
35, 65
20, 90
45, 55
Gerente 2
Gerente 1
Mantener
T1
T2
Mantener
50, -50
40, -40
45, -45
T1
20, -20
30, -30
50, -50
T2
70, -70
35, -35
10, -10
Definicin 6.0:
Mantener
s1
S1,
s2 S2
(1)Mantener
(3)
G1
T1
(5)
T2
(2)
(6)
T1
T2
50, -50
20, -20
70, -70
-70
-40
10
-50
Mn u1 (s1,s2)
s2
S2
S1 , s2
S2
As, el G1 elige
mantener
42
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
Si G2 decide mantener
El G1 elegir T2 y obtendr -70 (30%)
hE/sZ^/&ZE/^K's//h&'
Si G2 decide T1
El G1 elegir mantener y obtendr -40 (60%)
Gerente 2
Si G2 decide T2
El G1 elegir T1 y obtendr -50 (50%)
Gerente 1
Cambiar
Mantener
Cambiar
85, -85
70, -70
Mantener
60, -60
80, -80
La estrategia de seguridad de un J2 es la
estrategia s2
S2 que soluciona:
Max Mn u2 (s1,s2)
s2
S2 , s1 S1
As el G2 elige
T1(estrategia de seguridad)
Mn Max u1 (s1,s2)
s2
S2 , s1
S1
el J2 elegir un q
M 1,
M 2 que solucione.
Mn Eu (p,q)
q
M2
43
El J1 elegir p
esperada, es decir:
de su rival.
Max Mn Eu1 (p,q)
p
M 1, q
= V1
M2
Eu1 (p, q)
V1
M2
decir, J2 elige q
M 2, p
M1
el valor de
M 2, p
M1
esperada, es decir:
Eu1 (p, q)
Max Mn Eu2 (p,q)
q
M 2, p
M1
= V2
-V2,
M1
44
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Definicin 7.0:
Un juego G={N=i,j; Si, Sj; ui, uj} es un juego con
suma cero si para cualquier perfil de estrategias
si
Si, sj
Sj tenemos:
ti
Ejemplo:
Si , tj
Sj
0, 0
2, -2
6, -6
5, -5
Sj
sj
Sj , ti
Si
Sj
Definicin 8.0:
Sea G un juego con suma cero y con dos
jugadores i y j, (Si,Sj) es un EN, entonces:
ti
(si), t j
(si)
tj
(sj), ti
(si)
45
maximiza su ganancia.
Sea el juego:
Jugador j
C
Jugador i
Min
2, 4
0, 3
4, 1
10, 2
Max
10
principio Maximin.
Maximin
Minimax
Si, sj
Sj
Sj, si
maximiza su ganancia.
Si
Si i juega A, la estrategia de j que minimiza la
una ganancia de 4)
46
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
P1 una ganancia de 1.
i.
Siempre se cumple
si
Sj,
sj
Sj, si
Si
Criterio Minimax.
j
Ejercicio:
Considerar el juego del Dilema del prisionero
una ganancia de 1.
El P2 quiere minimizar la ganancia del
P1. Si P2 juega NC la mejor ganancia que
Confesar
NC
Confesar
2, 2
0, 5
NC
5, 0
1, 1
P2
P1
NC
Min
2, 2
0, 5
NC
5, 0
1, 1
Max
Maximin
Minimax
P2
Criterio Maximin.
Si P1 juega C, la estrategia que minimiza la
ganancia de P1 es NC que proporciona una
ganancia de 0.
Si P1 juega NC, la estrategia que minimiza
P1
Confesar
NC
Max
Confesar
2, 2
0, 5
NC
5, 0
1, 1
Min
Minimax
Maxmin
47
Maximin
Si P1 juega C, la estrategia que maximiza la
ganancia de P2 es NC que proporciona una
ganancia de 5.
proporciona
una ganancia de 1.
Juan
Mara
obtener es 1.
Min
-3
-3
-5
10
-5
Max
10
Min Max
obtener es 5.
P1 elige NC (el menor valor); as, el valor
j
Max Min
Minimax.
Si P2 juega C, la estrategia que minimiza la
Juan
Mara
Min
-3
-3
Max
Max Min
Min Max
48
y la
probabilidad de .
, y un pago de -3 con
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Juan
Mara
(-3) = -
Y si Mara selecciona B
(q) A
(1-q) B
-3
Si Mara selecciona A:
q (2) + (1 q) ( 3) = 2q 3 + 3q = 5q 3
Si Mara selecciona B:
q (0) + (1 q) (3) = 3 3q
vista de Juan.
q=
1 q =
8q = 6
) = (q, 1 q).
Si Mara juega A:
( ) (2)+ ( ) ( 3) =
Si Mara juega B:
( ) (0)+ ( ) (3) =
probabilidades
(asignar
mediante
algn
49
del juego.
Si Juan juega A:
sea en EP o en EM.
p (2) + (1 p) 0 = 2p
Si Juan juega B:
p (3) + (1- p) 3 = 3 6p
Igualando las dos ecuaciones, tenemos:
2p = 36p
p=
a continuacin:
1p =
Mara
por juego, de
-3
Si juega A:
( )(2) + ( )(0) =
Juan
A
2-(-3)=5
+3
0-(3)=-3
Probabilidad
de Mara
68
Si juega B:
( ) (3) + ( )(3) =
2-0 = 2
-3-3 = -6
Probabilidad
de Juan
68
).
50
Definicin9.0:
El resultado de un juego es llamado punto de
silla de montar si el ingreso de un resultado
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
entrada/ingreso en su columna.
Definicin 10.0:
Para cualquier matriz de un juego, si hay un
nmero
Juan
Mara
Min
-1
-20
-20
ms que
-16
16
-16
Max
16
, entonces
es llamado el valor
del juego.
Maximin
Minimax
Pagos
Juan
Mara
Filas
Columnas
Min
-3
-3
-5
10
-5
Max
10
Maximin
Minimax
51
estrategia.
J2
J1
(p)A
-2
(1-p)B
-1.5
J2 (Oponente)
J1
Min
-2
-2
-1.5
-1.5
Max
Minimax
Valores diferentes
No existe un PSM
J1
-2
-1.5
-1.5 -2 = -3.5
3.5
3
= 0.54 Probab.
= 0.46
el pago esperado
para J1 es:
J2
B
el pago
J1
= 0.54
= 2.5
-2-2 = -4
= 0.62
2.5
= 0.38
52
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
(1-X) A, XB.
Juan tiene 2.
Si Mara sabe o adivina la EM de Juan, ella
Si tales juegos no tienen un PSM, resulta que
Pagos de Mara
Juan
Mara
-3
-5
10
53
Juan
Probab.
de Mara
Juan
Mara
-3
que
Probab. de Juan
, jugara
estrategia C.
, el
la lnea para
siguientes clculos:
Para juego 2xn se puede aplicar la misma
Expectativas de Mara si Juan juega ( ) A y ( ) B
Juan
54
Mara
-2
-4
-3
-1
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
. Lo importante es
1. Obtener un valor
, 0, 0)
Mara ( , ) = ( A, B)
0, 1
2, 0
4, 4
3, 5
b)
j
i
2, 5
3, -1
-2, 0
5, 3
c)
Mara
Ftbol
Ballet
Ftbol
4, 1
0, 0
Ballet
0, 0
1, 4
d)
j
A
55
NC
2, 2
0, 5
NC
5, 0
1, 1
Juan
Pi
Pi
Pa
Ti
0, 0
-1, 1
1, -1
Mara
Pa
1, -1
0, 0
-1, 1
Ti
-1, 1
1, -1
0, 0
b)
J2
J1
Cara
Cruz
Cara
1, -1
-1, 1
Cruz
-1, 1
1, -1
-3
-1
-2
-6
-2
b) mx2
A
-2
c) 2xn
3. Dado el siguiente juego de Suma Constante,
transformarlo en un juego de Suma Cero y
encontrar el valor
-4
-2
-1
-3
.
6. Dada la matriz de juego 3x3, aplicar el mtodo
j
de Expectativas de Igualacin.
60, 60
70, 50
80, 40
75, 45
56
-1
-1
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Juan
Mara
A
B
a
c
b
d
aquellas soluciones.
LA PESCA JAMAICANA
57
de la orilla.
un juego 3x2.
Corriente
y desventajas:
Marcha
Pescador
No
marcha
Inside
17.3
11.5
Outside
-4.4
20.6
In-Out
5.2
17.0
i.
58
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Los
juegos
de
suma
cero
representan
de
si la guerrilla divide 2 0,
del tiempo,
3 Policas
2 Guerrillas
3-0
2-1
2-0
2-1
4 Policas
4-0
m = 2 y n = 3.
El reto de la guerrilla es como dividir su fuerza
entre los dos arsenales 2 0 o 1 1.
3-1
2-2
4 Guerrillas
3-1
2-2
1
1
59
i.
WWDD
STAR WARS
WDWD
WDDW
DWWD
DWDW
DDWW
12
13
14
23
24
34
Biologa.
60
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
APAREAMIENTO ASIMTRICO
Considera un simple juego de apareamiento
asimtrico en el cual una hembra (un Pjaro),
intenta mantener un macho para permanecer
con l y ayudar a crear una familia en lugar
J2
J1
-25
50
15
Macho
Hembra
de Halcones y de Palomas?
Fiel
Infiel
Tmida
(2, 2)
(0, 0)
Rpida
(5, 5)
(-5, 15)
las Palomas?
i.
Tmida y Rpida).
61
ganancia es 5
Entonces j elige C (el menor valor); as vi = 2 ;
Solucin al ejercicio # 2 b.
C (ganancia = 5)
j
i
Min
2, 5
3, -1
-2, 0
5, 3
-2
Max
Min Max
C (ganancia = 0)
i quiere minimizar la ganancia de j. Si juega
A la mejor ganancia es 5; si juega B la mejor
ganancia es 0
Entonces i elige B (el menor valor); as vj = 0 ;
I.
Maxi-Min: (Jugador i)
su ganancia de i]
Si i selecciona A, la Sj que minimiza la ganancia
Max
2, 5
3, -1
-2, 0
5, 3
Min
-3
i es C (ganancia = 2)
Si i selecciona B, la Sj que minimiza la ganancia
i es C (ganancia = -2)
Min Max
Max Min
IV. Maxi-Min
Si j Juega C, la Si que minimiza la ganancia j es
B (ganancia = 0)
Si j Juega D, la Si que minimiza la ganancia j es
B (ganancia = -3)
A (ganancia = 2)
ganancia es -3
B (ganancia = 5)
62
As
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Corriente
Marcha
Pescador
No
marcha
Inside
17.3
11.5
Outside
-4.4
20.6
In-Out
5.2
17.0
de 13.3.
iii. Cmo se compara la solucin del juego con
el comportamiento de los aldeanos? Por
qu no utilizan outside? Los pescadores
(capitn) no siguen la estrategia outside; ya
Corriente
Pescador
NM
Inside
17.3
11.5
In-Out
5.2
17.0
31%
69%
y su comportamiento no es afectado.
Diferencias en fila:
estrategias.
5.2 17 = 11.8
y 69%
pescar outside.
i.
Inside: (17.3)(0.31) +
63
Si q = 0.30
(p) Inside
(1-p) In-Out
(q) M
(1-q) NM
17.3
11.5
5.2
17.0
64
V
Juegos en forma extensiva
computadoras,
la
estuvo
expectante
de
pago de bonos.
Aproximadamente
al
mismo
tiempo,
Si
Katzenberg
decide
permanecer
en
66
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
apropiadamente
la
informacin
hE/sZ^/&ZE/^K's//h&'
de
los
entonces
est en el nodo b.
el
juego
termina.
Si
ambos
A Bugs Life.
67
En una forma extensiva hay una relacin, unaa-una entre la ruta y los nodos terminales.
ganancias,
resultados
preferidos.
Katzenberg
68
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Katzenberg-Eisner
elementos estratgicos.
representa
todos
los
1. Lista de jugadores.
2. Descripcin completa de lo que los jugadores
pueden hacer (sus posibles acciones).
3. Una descripcin de lo que los jugadores
saben cundo ellos actan.
4. Una especificacin de cmo las acciones
de los jugadores lideran los resultados.
5. Una especificacin de las preferencias de
los jugadores bajo sus resultados.
Otros ejemplos.
Identificar el conjunto de informacin de cada
Se utiliza la convencin de que uno de los pagos
a)
mover en el juego.
Solucin:
S1 = {U,D}
S2 = {AC, AE, BD, BE}
S3 = {RP, RQ, TP, TQ}
69
b)
d)
S2 = {0, I}
S2 = {X,Y}
ser pasivo
disfruta el monopolio.
Espacio de estrategias
S = {(OA,O), (OA, I), (OB, O)...}
Cada perfil de estrategias
u1 = (OA,O) = 2
u2 = (IA,O) = 3
observa a E1.
un vector de pagos:
70
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
J2
J1
1, 2
1, 2
3, 1
2, 4
Tienen diferentes
estructuras de
informacin.
Sk = {LPR, LPN, LNR, LNN, SPR, SPN, SNR, SNN}
71
140).
LPR
40, 110
80, 0
LPN
13, 120
80, 0
LNR
0, 140
0, 0
LNN
0, 140
0, 0
SPR
35, 100
35, 100
SPN
35, 100
35, 100
SNR
35, 100
35, 100
SNN
35, 100
35, 100
Solucin al ejercicio 1:
no
72
publicidad,
respectivamente.
Entonces
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
el comportamiento anticompetitivo. En
este caso, el apoderado general no observa
cul firma seleccion el precio alto (o si
ambas firmas seleccionaron el precio alto).
Dibujar la forma extensiva del juego,
asignar tus propios pagos (vector de pagos).
4. Dibujar la matriz en forma normal de
cada uno de los siguientes juegos en forma
extensiva.
a)
0, 0
Notar que la decisin de anunciar simultneamente
son capturadas suponiendo que en el segundo
conjunto de informacin de la firma A, la firma A
1, 1
2, 2
3, 4
b)
73
c)
J2
J1
AY
0, 3
0, 0
AN
2, 0
-1, 0
BY
0, 1
1, 1
BN
0, 1
1, 1
si existen EN.
Ejemplo: UBICACIN DE UN CENTRO DE
INVESTIGACIN
74
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Emp2
Emp1
4, 3
2, 2
1, 1
3, 4
4, 3
establezcan en el Sur.
Consideremos el caso en el que la
interaccin entre las empresas se da en
forma secuencial. La Empresa 1 establece su
2, 2
1, 1
3, 4
4, 3
2, 2
1, 1
3, 4
75
4, 3
jugar.
3, 4
posibles (N o S).
La Empresa 2 puede jugar en dos conjuntos de
informacin distintos, en el nodo b y en c. Una
estrategia debe indicar qu hacer si juega en b
y qu hacer si juega en c, as, en total tiene 4
estrategias posibles: {NN, NS, SN, SS}.
Emp2
76
Emp1
NN
NS
SN
SS
4, 3
4, 3
2, 2
2, 2
1, 1
3, 4
1, 1
3, 4
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Definicin 12:
Un juego en forma extensiva tiene informacin
centros de investigacin).
elige entre c y d.
Conociendo su propia eleccin anterior
entre a o b, pero sin conocer la decisin del J2
entre c y d, el J1 elige entre las acciones e y f.
77
Ejemplo:
1. El J1 elige entre a y b.
2. Sin conocer la decisin del J1, el J2 elige
entre c y d.
Definicin 13:
b o si eligi a y J2 eligi d.
78
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
Monopolio
e
f
Entrante
NR
-1, -1
2, 2
0, 4
0, 4
Definicin 14:
Un equilibrio perfecto en subjuegos (EPS) de
un juego en forma extensiva es un EN, que,
adems, proporciona un EN en cada subjuego
del juego.
El primer subjuego
Monopolista
Entrante
NR
-1, -1
2, 2
0, 4
79
encontrar el EPS.
a) Cuando J1 elija a
S2 = {c, d} ; S1 = {e, f}
4, 2
3, 1
2, 1
1, 2
J2
J1
e
f
4, 2
2, 1
3, 1
1, 2
J2
b) Cuando J1 elija b
S2 = {c, d} ; S1 = {e, f}
80
J2
actuar de
J1
e
f
5, 2
3, 4
2, 1
2, 4
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
J2
CC
J1
CD
DC
DD
AEE
4, 2
4, 2
2, 1
2, 1
AEF
4, 2
4, 2
2, 1
2, 1
AFE
3, 1
3, 1
1, 2
1, 2
AFF
3, 1
3, 1
1, 2
1, 2
BEE
5, 2
3, 4
5, 2
3, 4
BEF
2, 1
2, 4
2, 1
2, 4
BFE
5, 2
3, 4
5, 2
3, 4
BFF
2, 1
2, 4
2, 1
2, 4
otros EN.
Bibliografa
Cerd, E., Prez, J., Jimeno, J., (2004). Teora de
Madrid, Espaa.
Companies.
edicin.
EUA.
The
Mathematical
Association of Amrica.
Glosario
A
Comportamiento
decisiones propias.
estratgico:
Es
un
de
tcnicas
procedimientos
D
Distribucin de probabilidad: Lista de todos los
E
Eliminacin iterativa de las estrategias
estrictamente dominadas: Cuando un jugador
.,s*i-1, si ,s*i+1,,s*n).
conviene utilizar.
En el juego en forma normal G= {S1,.,Sn;u1,
,un}, sean si y si posibles estrategias del
jugador i (si y si son elementos de Si). La
estrategia si est estrictamente dominada por la
estrategia si si para cada combinacin posible
de las estrategias de los restantes jugadores, la
ganancia de i por utilizar si es estrictamente
(s1,,si-1,si+1,,sn)
86
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
denota: S= {S1,Sn}.
mi en Mi.
Una estrategia
E1, el nivel de
E2, el nivel de
87
forma simultnea.
en cuestin.
u1(s1,s2) + u2(s1,s2) = c, c
R,
s1
S1 ,
s2
S2
M
Maximin: El valor Maximin (o valor inferior
del juego) del jugador I es.
88
/E^d/dhdK/E/dEK>K'1/EEKs/ME/d/
hE/sZ^/&ZE/^K's//h&'
P
Pagos: Cada jugador recibe un pago al terminar
el juego, que depende de cul haya sido el
resultado del juego. El significado de dicho
pago es la utilidad que cada jugador atribuye a
dicho resultado, es decir la valoracin que para
el jugador tienen las consecuencias de alcanzar
un determinado resultado en el juego.
entrada/ingreso en su columna.
Un juego matricial de matriz A= (aij) tiene un
punto de silla en estrategias puras cuando se
verifica que: vI=vII Este valor comn se llama
valor del juego y es el menor elemento de su fila
y el mximo de su columna. Se denota por v.
Si una matriz de un juego tiene un punto de silla
de montar (PSM), ambos jugadores jugaran
una estrategia en la cual est contenida.
Para cualquier matriz de un juego, si hay un
nmero i tal que el jugador 1 tiene una estrategia,
la cual garantiza que ganar al menos i, y el
jugador 2 tiene una estrategia la cual le garantiza
que el jugador 1 ganar no ms que i, entonces i
es llamado el valor del juego.
Si un jugador tiene un PSM, el ingreso del PSM
Cualquier
89
Lista de smbolos
La siguiente lista est compuesta por los
smbolos que se utilizan frecuentemente en la
temtica de Teora de Juegos:
Igual a
>
Mayor a
<
Menor a
Mayor o igual a
Menor o igual a
Por lo tanto
estrategias mixtas.
No existe
Sumatoria
Pertenece a
No pertenece a
Entonces
denota U= {u1,..un}
90
Incremento
||
Valor absoluto
Infinito
S y solo si
UFG-Editores