Teoria de Juegos Capitulo 1b

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA
Felipe Peredo R. 29
MODELO DE DOS MERCADOS DE BERTRAND

Se consideran dos mercados de bienes sustitutos en los cuales operan 2
empresas monoplicas produciendo la primera de ellas una cantidad q1 del
bien 1 y la empresa 2 una cantidad , q2 del bien 2.
Las funciones de costos son: CT1 = cq1 ; CT2 = cq2
Las funciones de demanda de los mercados de los bienes 1 y 2 son:
,
q2 = a P2 + bP1 con c < a , 0 < b < 2
q1 = a P1 + bP2
Los beneficios u1, u2 de las empresas se pueden expresar como funciones solo
de los precios como se indica a continuacin.
u1 = I1 CT1 = P1q1 cq1 = (P1 c)q1 = (P1 c)( a P1 + bP2)
u1 = (P1 c)( a P1 + bP2) ..(1)
o bien, en forma desarrollada:
u1 = -ac + (a+c)P1 P12 bcP2 + bP1P2 ..(1)
u2 = I2 CT2 = P2q2 cq2 = (P2 c)q2 = (P2 c)( a P2 + bP1)
u2 = (P2 c)( a P2 + bP1) ..(2)
o bien, en forma desarrollada:
u2 = -ac + (a+c)P2 P22 bcP1 + bP1P2 ..(2)
Calcularemos el punto de equilibrio (P1*, P2*) de los mercados, as como los
beneficios correspondientes u1* , u2* de las empresas.
Veremos tambin que, en el equilibrio los beneficios de ambas empresas son
positivos: u1* > 0 , u2* > 0
SOLUCION
No se pueden determinar P1*, P2* directamente maximizando los beneficios
de las empresas, pues ambas funciones dependen de las dos variables; la
maximizacin de u1 ocurrir en un cierto punto, mientras que el valor mximo
de u2 tendr lugar en otro punto diferente.
Observemos que la participacin de las empresas en sus respectivos mercados
es un juego de dos jugadores cuyas estrategias son los precios de los respectivos productos, y los pagos son los beneficios de las empresas.
De acuerdo con las funciones de beneficio previamente calculadas, vemos que
los pagos de cada uno de los jugadores dependen no solo de su propia
decisin, sino de la combinacin de estrategias de ambas empresas.
Felipe Peredo R. 30
Podemos encontrar el punto de equilibrio de los mercados como el equilibrio

de Nash del juego:
La empresa 1 supone que la otra eligi en su precio de equilibrio P2* y
maximiza u1(P1,P2*) = -ac + (a+c)P1 P12 bcP2* + bP1P2*
d u1(P1 ,P2*) d ac +(a + c)P1 + bP2*P1 - P12
=
= (a+c) + bP2* - 2P1 = 0
d P1
d P1
2P1*- bP2* = (a + c) .(3)
Verificamos la condicin de segundo orden para u1(P1,P2*):
u1 = -2 < 0, por lo tanto u1(P1,P2*) tiene un mximo en P1*
La empresa 2 supone que la primera eligi en su precio de equilibrio P1* y
maximiza u2(P1*,P2) = -ac + (a+c)P2 P22 bcP1* + bP1*P2
d u2(P1* ,P2 ) d ac +(a + c)P2 + bP2P1* - P22
=
= (a+c) + bP1* - 2P2 = 0
d P2
d P2
-bP1* + 2P2* = (a + c) .(4)
Verificamos la condicin de segundo orden para u2(P1*,P2):
u2 = -2 < 0, por lo tanto u2(P1*,P2) tiene un mximo en P2*
Las ecuaciones (3) y (4) forman un sistema de 2 ecuaciones lineales con dos
incgnitas:
2P1* bP2* = (a + c)
Aplicando la regla de Cramer se obtiene:
bP1* + 2P2* = (a + c)
2(a + c)+ b(a + c)
factorizando las expresiones y simplificando:
P1* =
4 b2
(a + c)(2 + b) (a + c)
P1* =
=
(2 b)(2 + b) (2 b)
2(a + c)+ b(a + c) (a + c)
P2* =
=
(2 b)
4 b2
(a + c) (a + c)
Por lo tanto: (P1* , P2*) =
,
es el equilibrio de Nash del
(2 b) (2 b)
modelo de Bertrand.
Ahora vamos a calcular u1* , u2* (conviene usar las ecuaciones (1) y (2))
u1* = u1(P1*,P2*) = (P1* c)( a P1* + bP2*) =
(a + c) (a + c)
(a + c)
u1* =
c a
+b
(2 b) (2 b)
(2 b)
simplificando las expresiones dentro de los parntesis:
Felipe Peredo R. 31
(a c + bc) (a c + bc) (a c + bc)

u1 =
=
> 0 porque c < a
(2 b) (2 b) (2 b)
De manera similar se calcula u2* :
u2* = u2(P1*,P2*) = (P2* c)( a P2* + bP1*)
*
(a + c) (a + c) (a c + bc)
(a + c)
u2 =
=
>0
c a
+b
(2 b) (2 b) (2 b)
(2 b)
Conclusin: en el modelo de Bertrand las dos empresas obtienen ganancias
positivas en el equilibrio de Nash.
*
EL MODELO DE LA SUPERVISIN
Un empleado tiene las opciones de dedicar todo su tiempo laboral a
desempear el trabajo que se le asigna (estrategia T) bien puede dedicar
parte del tiempo laboral a realizar otras actividades que incrementan sus
ingresos(estrategia O).
Por su parte, el jefe inmediato de dicho empleado puede supervisar
frecuentemente al empleado, lo cual tiene un elevado costo (estrategia S),
bien puede no supervisarlo (estrategia N).
Si el empleado es supervisado y se le descubre realizando otras actividades, se
le sanciona no pagndole ese da.
Consideramos la situacin anterior como un juego de dos jugadores, donde el
pago del primer jugador (el empleado) es su ingreso, mientras que el pago del
segundo jugador (el jefe) es proporcional al beneficio de la empresa.
Los pagos correspondientes a cada combinacin de estrategias se muestran en
el cuadro siguiente, donde w es el salario por da del empleado.
J2 (jefe)
(u1,u2) =
J1 (empleado)
T
O
(w , 20-w-4)
(0, 6)
(w , 20-w)
(w+6 , 10-w)
a) Si el salario es w 4 , determinar si el juego tiene equilibrio de Nash

b) Si el salario es w > 4 , determinar si el juego tiene equilibrio de Nash
SOLUCION
a) Suponemos w 4 , entonces w -4 10-w 10-4 10-w 6
Felipe Peredo R. 32
Considerando lo anterior hacemos la maximizacin de u1 por columnas y la de

u2 por renglones:
J2 (jefe)
S
(u1,u2) = J1 (empleado)
T
O
Max u1
(w , 20-w-4)
(0, 6)
w
20-w
(w+6 , 10-w) 10-w
w+6
Max u2
(w , 20-w)
El juego tiene un equilibrio de Nash: E= (x1* , x2*) = (O,N)

Los pagos correspondientes son: (u1* , u2*) = (w+6 , 10-w)
Es decir, el empleado dedicar parte del tiempo laboral a otras actividades y el
jefe no realizar supervisin.
b) Cuando w > 4, entonces w < -4 10-w < 10-4 10-w < 6
Considerando lo anterior hacemos la maximizacin de u1 por columnas y la de
u2 por renglones:
J2 (jefe)
S
(u1,u2) = J1 (empleado)
Max u1
T
O
(w , 20-w-4)
(0, 6)
w
N
20-w
(w+6 , 10-w) 6
w+6
Max u2
(w , 20-w)
El juego no tiene equilibrio de Nash

(en la seccin Ig estudiaremos un mtodo para resolver juegos que no tienen
equilibrio de Nash).
MODELO DE HOTELLING
Hay dos tiendas (1,2) situadas en una avenida en los puntos , con
0 < 1. Ambas tiendas venden un mismo bien a precios p1 , p2
respectivamente.
Supuestos.
1) La poblacin se distribuye uniformemente en el intervalo [0,1], por lo tanto,
el porcentaje de la poblacin que est en un segmento cualquiera est dado por
Felipe Peredo R. 33
la longitud de dicho segmento (por ejemplo, en el intervalo 0.5 x 0.75 que

tiene longitud (0.75-0.5) = 0.25 , se localiza el 25 % de la poblacin)
2) Para cualquier par de precios p1 0, p2 0 todos los consumidores
compran 1 unidad del bien 1 (en un perodo de tiempo dado), ya sea en la
tienda 1 en la tienda 2.
3) Cada consumidor decide en que tienda comprar tomando en cuenta la
distancia que tiene que desplazarse y el precio, de acuerdo con la regla
siguiente:
Si t(x-)2 + p1 < t(x-)2 + p2 , entonces compra en la tienda 1 ,
Si t(x-)2 + p1 > t(x-)2 + p2 , entonces compra en la tienda 2 ,
Si t(x-)2 + p1 = t(x-)2 + p2 , entonces es indiferente comprar en 1 en 2
Donde t > 0 es un factor constante.
Notas: a) Si un consumidor ubicado en el punto x compra en la tienda 1,
entonces todos los consumidores y a la izquierda de l (0 y x) tambin
compran en la tienda 1 (ver figura siguiente).
b) Si un consumidor que est en el punto x , elige comprar en la tienda 2,

entonces todos los consumidores ya la derecha de x tambin comprarn en la
tienda 2 (ver figura anterior)
4) Las demandas q1 , q2 de las tiendas son proporcionales a los porcentajes de
la poblacin que eligen comprar en cada una de ellas.
Determinacin de las demandas en funcin de los precios.
Dados p1 , p2 consideramos al consumidor x* al cual le resulta indiferente
comprar en la tienda 1 2, entonces: t(x*-)2 + p1 = t(x*-)2 + p2
Desarrollando los binomios al cuadrado y simplificando, se obtiene:
2t(-)x* = t(2-2)+(p2-p1)
p p1
+
x* =
despejando x* y simplificando:
+ 2
2
2t( )
De acuerdo a las observaciones previas, todos los consumidores en el intervalo
[0 , x*) comprarn en la tienda 1, mientras que todos los consumidores en el
intervalo (x* , 1] comprarn en la tienda 2 (ver figura siguiente).
Por lo tanto las demandas de cada una de las tiendas son:
Felipe Peredo R. 34
q1 = N(x* - 0)
p p1
+
]
+ 2
2
2t( )
Donde N > 0 es una constante conocida
q2 = N(1 - x*)
p p1
+
)]
q1 = N[ 1 (
+ 2
2
2t( )
5) las tiendas 1 y 2 tienen costos proporcionales a las cantidades que venden:
CT1 = cq1 , C T2 = cq2
q1 = N x* = N[
Vamos a calcular los precios de equilibrio p1* , p2* del modelo.

SOLUCION
En primer lugar observemos que la fijacin de precios por parte de las
empresas es un juego en el cual las estrategias de las tiendas son los precios
que eligen, y los pagos de los jugadores son los beneficios correspondientes de
cada tienda:
p p1
+
u1 = p1q1 cq1 = (p1 c)q1 = (p1 c) N[
]
+ 2
2
2t( )
p p1
+
u2 = p2q2 cq2 = (p2 c)q2 = (p2 c) N[1 (
)]
+ 2
2
2t( )
La solucin del modelo ser el equilibrio de Nash del juego: E = (p1* , p2*)
Clculo del equilibrio.
La primera tienda maximiza su beneficio suponiendo que la otra tienda ya
eligi su precio de equilibrio:
p*2 p1
+
*
+
Maximiza u1(p1 , p2 ) = (p1 c) N[
]
2
2t( )
+
p* p1
d N(p1 c)
+ 2
2
2t( )
d u1(p1 ,p*2)
=
=0
d p1
d p1
Desarrollando la derivada:
p*2 p1
1
+
+
N(p1-c)
+ N[
](1) = 0
2t( )
2
2t( )
1
Multiplicando toda la ecuacin por 2t(-):
N
Felipe Peredo R. 35
-(p1*-c) + N[ t(-)(+) + (p2*-p1*) ] = 0

transponiendo trminos:
2p1* - p2* = t(2-2) + c ..(1H)
De manera similar, la tienda 2 maximiza su beneficio suponiendo que la

tienda 1 ya eligi su precio de equilibrio:
p2 p*1
+
*
+
)]
Maximiza u2(p1 , p2) = (p2 c) N[ 1 (
2
2t( )
+
p2 p*1
d N(p2 c)1
2
2t( )
d u2(p*1 ,p2)
=0
=
d p2
d p2
Desarrollando la derivada:
p2 p*1
1
+
N(p2-c)
+ N[1](1) = 0
2t( )
2
2t( )
1
Multiplicando toda la ecuacin por 2t(-):
N
*
-(p2 -c) + N[2t(-)- t(-)(+) + (p2*-p1*) ] = 0
transponiendo trminos:
-p1* + 2p2* = 2t(-) -t(2-2) + c ..(2H)
Las ecuaciones (1H) y (2H) forman un sistema de dos ecuaciones lineales con
dos incgnitas. Aplicando la regla de Cramer, obtenemos la solucin:
2 1
=41=3
=
1 2
1 =
{t( )+ c }
{2t( ) t(
2
2)+ c
2
2
2
2
1 = 2{t( - )+c} + {2t(-)-t( -2) + c } = 3c + 2t(-) +t(2-2)
2 =
{t( )+ c }
{2t( ) t(
2
2
1
2)+ c
2 = 2{2t(-)-t(2-2) + c }+{t(2-2)+c} = 3c + 4t(-) -t(2-2)
p1* =
1
1
1
= c + t(-)[++2] , p2* = 2 = c + t(-)[4]
3
3
Equilibrio de Nash del modelo de Hotelling:
E = (p1* , p2*) = ( c +
1
3
t(-)[++2] , c +
1
3
Felipe Peredo R. 36
t(-)[4] )
Notas sobre la solucin del modelo de Hotelling.

1) Se puede verificar fcilmente que las configuraciones particulares ,
tales que + = 1 conducen a soluciones de equilibrio con precios iguales:
p1* = p2* = c + t(-) , grficamente esto corresponde a ubicaciones
simtricas de las tiendas (la tienda 1 est a una distancia del extremo
izquierdo (0) y la tienda 2 est a la misma distancia del extremo derecho del
intervalo (1) como se muestra en la siguiente grfica:
2) Tambin se puede mostrar grficamente cuales configuraciones ,

conducen a precios de equilibrio p1* > p2* (aquellas con > 1 - ) y cuales
conducen a precios de equilibrio p1* > p2* (aquellas con < 1 - ) como se
muestra en el siguiente diagrama:
Felipe Peredo R. 37
TEMA I g) ESTRATEGIAS MIXTAS
Vamos a estudiar dos mtodos para resolver juegos finitos de dos jugadores
que no tienen equilibrio de Nash. En primer lugar se revisar un mtodo para
maximizar funciones lineales con un parmetro, despus estudiaremos el
mtodo grfico para resolver juegos en los cuales cada jugador tiene dos
estrategias, y por ltimo veremos un mtodo para resolver juegos finitos en un
nmero cualquiera de estrategias para cada jugador.
ANTECEDENTE
Se determinar el punto ptimo x* en el cual una funcin lineal f(x) = a + bx
definida en el intervalo cerrado 0 x 1 tiene su valor mximo.
Las siguientes grficas ilustran grficamente la localizacin del punto ptimo
en tres situaciones posibles (dependiendo del signo de la pendiente de la recta
y = a + bx)
Resumimos los tres casos en la siguiente frmula:

si pendiente b > 0
1
x* = 0
si pendiente b < 0
cualquier punto en [0,1] si pendiente b = 0
Una funcin lineal con un parmetro k es una funcin lineal en la variable x

que contiene en uno en ambos coeficientes al trmino constante k
Ejemplo: f(x) = (3k-1)x + 4 es una funcin lineal con el parmetro k
Felipe Peredo R. 38
Mtodo para maximizar una funcin lineal f(x) con un parmetro k

1) Identificamos la pendiente b = b(k) de la funcin lineal
2) Escribimos la frmula del punto ptimo de la funcin lineal:
si pendiente b > 0
1
*
x = 0
si pendiente b < 0
cualquier punto en [0,1] si pendiente b = 0
3) Expresamos la frmula anterior en trminos de k

4) Graficamos el conjunto de puntos ptimos (x*,k) que muestra donde
se ubican los ptimos x* para los diferentes valores del parmetro.
Ejemplo 1
Para la funcin lineal: f(x) = (3k-1)x + 4 donde 0 x 1 , k es una
constante entre 0 y 1 (0 k 1), obtener y graficar los puntos ptimos x* en
los cuales f(x) alcanza su valor mximo.
SOLUCION
La pendiente de la grfica de f(x) es b = (3k-1), por lo tanto:
si pendiente (3k - 1) > 0
1
x* = 0
si pendiente (3k - 1) < 0
cualquier punto en [0,1] si (3k - 1) = 0
Despejando k de las desigualdades:

si k > 1/3
1
*
x = 0
si k < 1/3
cualquier punto en [0,1] si k = 1/3
Ahora trazamos un sistema de ejes coordenados x*-k y marcamos los

intervalos (en el eje vertical) que corresponden a cada caso:
Felipe Peredo R. 39
Ahora dibujamos los puntos (x*,k) que corresponden a cada caso: los puntos
de los casos k > 1/3 , k < 1/3 son segmentos verticales, mientras que los
puntos del tercer caso se encuentran en un segmento horizontal:
AQU TERMINAN LOS ANTECEDENTES DEL TEMA Ig
En la seccin Ib vimos que el siguiente juego no tiene equilibrio de Nash:

J2
(u1,u2)=
J1
A
B
M
(0 , 1)
(4 , 2)
N
(2, 0)
(1, 3)
Si el juego se realiza un nmero grande de veces, no le conviene al jugador 1

usar siempre la misma estrategia (por ejemplo la B), porque el otro jugador
pronto se dar cuenta y aprovechar esa informacin para obtener el mejor
pago (N) ocasionando que el pago del jugador 1 sea bajo (menor al de otras
combinaciones de estrategias).
Por esta razn, al jugador 1 le conviene ms elegir su estrategia de modo que
el otro jugador no pueda predecirla, la forma de hacer esto es elegir su
estrategia al azar, asignando una probabilidad (o frecuencia) p a la estrategia
A y una probabilidad (1-p) a la estrategia B.
Felipe Peredo R. 40
Por un razonamiento semejante, al jugador 2 no le conviene jugar siempre con

la misma estrategia, sino elegir al azar su estrategia asignando una probabilidad q a la estrategia M y una probabilidad (1-q) a la estrategia N.
Como la eleccin de las estrategias se realiza de modo independiente (la
estrategia que elige cada jugador no influye sobre la eleccin del otro jugador)
De acuerdo con las reglas de la teora de la probabilidad, cada combinacin de
posibles estrategias tender a ocurrir con las frecuencias que se indican a
continuacin:
P(A,M) = P(A)P(M) = pq
P(A,N) = P(A)P(N) = p(1-q)
P(B,M) = P(B)P(M) = (1-p)q
P(B,N) = P(B)P(N) = (1-p) (1-q)
Por ejemplo, si p = 30% , q = 60% , en el siguiente cuadro se muestran, de 100
veces que se realiza el juego, que porcentaje de veces ocurre cada
combinacin de estrategias:
J2
(u1,u2)=
J1
Prob
A (.30)
B(.70)
M(.60)
(0 , 1) .18
(4 , 2) .42
N(.40)
(2, 0) .12
(1, 3) .28
Podemos estimar el pago total y el pago promedio que obtendr cada jugador
despus de 100 repeticiones del juego:
u1T = 18veces(pago 0) + 12(2) + 42(4) + 28(1) = 220
u
18
12
42
28
(0) +
(2) +
(4) +
(1) = 2.20
u1promedio = 1T =
100 100
100
100
100
u2T = 18veces(pago 1) + 12(0) + 42(2) + 28(3) = 186
u
18
12
42
28
(1) +
(0) +
(2) +
(3) = 2.20
u1promedio = 1T =
100 100
100
100
100
Notacin: llamaremos pago esperado v1 al pago promedio del primer jugador
y pago esperado v2 al pago promedio del segundo jugador
En general, cuando las probabilidades son p, (1-p), q, (1-q) y los pagos son
u1( si , tj ) = a ij los pagos del 1er jugador
u2( si , tj ) = bij los pagos del 2do jugador
entonces los pagos esperados estn dados por:
v1 = a11pq + a12p(1-q) + a21(1-p)q + a22(1-p)(1-q)
v2 = b11pq + b12p(1-q) + b21(1-p)q + b22(1-p)(1-q)
Felipe Peredo R. 41
Definiciones.
1) Se le llama Estrategia Mixta (p, 1-p ; q, 1-q) a una asignacin de
probabilidades a cada una de las estrategias de los jugadores
2) Un Equilibrio de Nash de estrategias mixtas EM = (p*, 1-p* ; q*, 1-q*)
es una estrategia mixta que maximiza el pago esperado de cada jugador
suponiendo que el otro jugador eligi sus probabilidades de equilibrio.
Es decir que, para encontrar EM :
-Se maximiza v1(p,q*) y se maximiza v2(p*,q)
Observacin. Como v1(p,q*) y v2(p*,q) son funciones lineales con un
parmetro definidas en los intervalos cerrados 0p1 , 0q1 respectivamente
para maximizarlas hay que aplicar el mtodo de los puntos ptimos estudiado
en los antecedentes.
CALCULO DEL EQUILIBRIO CON ESTRATEGIAS MIXTAS para juegos
de 2 jugadores de 22
1. Escribimos las probabilidades de las estrategias individuales (p, 1-p) en el
margen izquierdo de la matriz de pagos; (q, 1-q) en el encabezado de la
matriz de pagos.
2. Desarrollamos y simplificamos las funciones de pagos esperados de los
jugadores: v1 y v2 . Conviene factorizar p en la frmula de v1 y factorizar q
en la frmula de v2 .
3. Se efectan las maximizaciones de v1(p,q*) y de v2(p*,q) , representando
grficamente los puntos ptimos (p*,q*) de cada una de las funciones en un
mismo sistema de coordenadas.
4. Las probabilidades p*, q* del equilibrio quedarn determinadas en la
interseccin de las dos grficas de puntos ptimos.
Ejemplo 2
Calcular el equilibrio de Nash de estrategias mixtas del siguiente juego y los
pagos esperados correspondientes.
J2
(u1,u2)=
J1
SOLUCION
A
B
M
(0 , 1)
(4 , 2)
N
(2, 0)
(1, 3)
Felipe Peredo R. 42
En la siguiente tabla hemos anotado las probabilidades de las estrategias:

J2
(u1,u2)=
J1
Prob
A (p)
B(1-p)
M(q)
(0 , 1) pq
(4 , 2) (1-p)q
N(1-q)
(2, 0) p(1-q)
(1, 3) (1-p)(1-q)
Los pagos esperados son:

v1 = 0pq + 2p(1-q) + 4(1-p)q + 1(1-p)(1-q)
desarrollando: v1 = 2p-2pq + 4q-4pq + 1 p q + pq
simplificando: v1 = 1+3q + p 5pq
Por lo tanto: v1 = (1+3q)+ (1 5q)p
v2 = 1pq + 0p(1-q) + 2(1-p)q + 3(1-p)(1-q)
desarrollando: v2 = pq + 2q-2pq + 3 3p 3q + 3pq
simplificando: v2 = 3-3p q + 2pq
Por lo tanto: v2 = (3-3p) + (-1 + 2p)q
Primera maximizacin:
Maximizar v1(p,q*) = (1+3q*)+ (1 5q*)p
con 0 p 1
*
*
Como q es constante, v1(p,q ) es una funcin lineal con un parmetro (q*) y la
pendiente de la recta es: (1 5q*)
Por lo tanto los puntos ptimos p* que maximizan la funcin son:
1
si pendiente (1 - 5q*) > 0
si pendiente (1 - 5q*) < 0

p* = 0
*
cualquier punto en [0,1] si (1 - 5q ) = 0
Despejando q* en las desigualdades:

1
si q* < 1/5
si q* > 1/5
p* = 0
cualquier punto en [0,1] si
q* = 1/5
Felipe Peredo R. 43
Segunda maximizacin:
con 0 q 1
Maximizar v2(p*,q) = (3-3p*) + (-1 + 2p*)q
*
*
Como p es constante, v2(p ,q) es una funcin lineal con un parmetro (p*) y la
pendiente de la recta es: (-1 + 2p*)
Por lo tanto los puntos ptimos q* que maximizan la funcin son:
1
si pendiente (-1 + 2p*) > 0
*
si pendiente (-1 + 2p*) < 0
q = 0
*
cualquier punto en [0,1] si (-1 + 2p ) = 0

1
si p* > 1/2
si p* < 1/2
q* = 0
cualquier punto en [0,1] si
p* = 1/2
Dibujamos la grfica de los puntos ptimos de v2(p*,q) en el mismo diagrama

en el que se dibujaron los puntos ptimos de v1(p,q*) (figura anterior):
Felipe Peredo R. 44
En la figura se observa que el punto de interseccin de los dos conjuntos

maximiza ambas funciones y por lo tanto es el equilibrio: p* = 1/2 , q* = 1/5
El equilibrio de Nash de estrategias mixtas es:
EM = (p*, 1-p* ; q*, 1-q*) = ( 1/2 , 1/2 ; 1/5 , 4/5 )
Por ultimo, los pagos esperados en el equilibrio son:

v1* = v1(p*,q*) = (1+3q*)+ (15q*)p* = (1+3[0.2])+(15[0.2])0.5 = 1.6
v2* = v2(p*,q*) = (3-3p*)+(-1+2p*)q* = (3-3[0.5])+(-1+2[0.5])0.2 = 1.5
Comentario: los pagos esperados en el equilibrio de Nash de estrategias
mixtas son mejores a los pagos que obtendra cualquiera de los jugadores si
elige una estrategia fija alguna otra estrategia mixta diferente de EM
Nota. En algunos juegos finitos al aplicar el mtodo de estrategias mixtas se
obtiene una solucin en la cual (p* = 0 p* = 1) y/o (q* = 0 q* = 1), esto
tiene una interpretacin especial:
Si p*=0 entonces J1 nunca elegir su primera estrategia (siempre la segunda)
Si p*=1 entonces J1 siempre elegir su primera estrategia (nunca la segunda)
Si q*= 0 entonces J1 nunca elegir su primera estrategia (siempre la segunda)
Si q*=1 entonces J1 siempre elegir su primera estrategia (nunca la segunda)
Ejemplo 3 Consideremos el juego:
A
B
I
(3 , 2) (2 , 0)
(u1, u2): J1
II
(1 , 0) (0 , 2)
a) Resolver el juego por el mtodo de estrategias dominadas
Felipe Peredo R. 45
b) Resolver el juego por el mtodo de estrategias mixtas

c) Comparar las soluciones obtenidas en los dos incisos
SOLUCION
a) Comparando los pagos u1 por renglones (estrategias de J1) vemos que la
estrategia II est dominada por la I, por lo tanto eliminamos el rengln II de la
matriz de pagos y queda:
A
B
(u1, u2): J1
I
(3 , 2) (2 , 0)
Para el jugador 2 la estrategia B est dominada por A, por lo tanto eliminamos la columna B de la matriz y se obtiene:
A
(u1, u2): J1
I
(3 , 2)
Por lo tanto existe una combinacin ptima de estrategias : ( s,t ) = (I , A)
y los pagos ptimos son: ( u1 ,u 2 ) = (3 , 2)
b) Los pagos esperados son:
(u1, u2): J1
I (p)
II (1-p)
A (q)
(3 , 2)
(1 , 0)
B (1-q)
(2 , 0)
(0 , 2)
v1 = 3pq + 2p(1-q) + 1(1-p)q

desarrollando y simplificando: v1 = 2p + q
v2 = 2pq + 0p(1-q) + 0(1-p)q + 2(1-p)(1-q) = (2-2p) + (4p-2)q
Maximizacin de v1(p,q*) = 2p + q* Es una funcin lineal, la pendiente de la
recta es positiva, por lo tanto el punto ptimo es p* = 1
Maximizacin de v2(p*,q) = (2-2p*) + (4p*-2)q
con 0 q 1
Felipe Peredo R. 46
v2(p*,q) es una funcin lineal con un parmetro y la pendiente de la recta es :

(4p* -2), Por lo tanto los puntos ptimos q* que maximizan la funcin son:
1
si pendiente (4p* - 2) > 0
si pendiente (4p* - 2) < 0

q* = 0
*
cualquier punto en [0,1] si (4p - 2) = 0
1
si p* > 1/2
si p* < 1/2
q* = 0
*
cualquier punto en [0,1] si p = 1/2
En la grfica vemos que el equilibrio se localiza en p* = 1 , q* = 1

El equilibrio de Nash de estrategias mixtas es:
EM = (p*, 1-p* ; q*, 1-q*) = ( 1 , 0 ; 1 , 0 )
Por la interpretacin previamente explicada, esto significa que el jugador 1

elegir siempre su primera estrategia I y el jugador 2 elegir siempre su
primera estrategia A, por lo tanto esta solucin coincide con la obtenida en el
inciso a) de este mismo problema:
( s ,t ) = (I , A) y los pagos ptimos son: (u

*
Observaciones:
*
*
1 ,u2
) = (3 , 2)
Felipe Peredo R. 47
1) Algunos juegos tienen varios equilibrios de estrategias mixtas, ms

adelante se mostrar un ejemplo de ello.
2) Si un juego se puede resolver por el mtodo de estrategias dominadas
por el mtodo del equilibrio de Nash (de estrategias puras), entonces
tambin se puede resolver por el mtodo de estrategias mixtas y la
solucin obtenida constar de uno varios puntos que incluyen a la
solucin previa (obtenida por estrategias dominadas por equilibrio de
Nash).
3) Existe una demostracin general de que, cualquier juego finito (cuyos
conjuntos de estrategias son diferentes del vaco) tiene por lo menos una
solucin de equilibrio de Nash con estrategias mixtas.
Ejemplo 4. EL JUEGO H-M (Hombre-Mujer).
Resolver el juego siguiente (explicado en el captulo I) por el mtodo de
estrategias mixtas.
J2 (M)
(u1,u2) = J1 (H)
B
O
(4, 2)
(0, 0)
O
(1, 1)
(2, 4)
SOLUCION
Anotamos las probabilidades de las estrategias de cada jugador:
J2 (M)
(u1,u2) = J1 (H)
B (p)
O (1-p)
(q)
(4, 2)
(0, 0)
O (1-q)
(1, 1)
(2, 4)
Los pagos esperados son:

v1 = 4pq + 1p(1-q) + 0(1-p)q + 2(1-p)(1-q) = 4pq+p-pq+22p2q+2pq
simplificando: v1 = 2 - 2q - p + 5pq = (2- 2q) + (5q 1)p
v2 = 2pq + 1p(1-q) + 0(1-p)q + 4(1-p)(1-q)
desarrollando: v2 = 2pq + p-pq + 4 4p 4q + 4pq = 4 3p 4q + 5pq
Por lo tanto: v2 = (4 3p) + (5p - 4)q
Maximizar v1(p,q*) = (2-2q*) + (5q* 1)p
con 0 p 1
*
v1(p,q ) es una funcin lineal con un parmetro (q*) y la pendiente de la recta
es: (5q*1) por lo tanto los puntos ptimos p* que maximizan la funcin son:
Felipe Peredo R. 48
1
si pendiente (5q* - 1) > 0
si pendiente (5q* - 1) < 0

p* = 0
*
cualquier punto en [0,1] si (5q - 1) = 0
1
si q* > 1/5
si q* < 1/5
p* = 0
*
cualquier punto en [0,1] si q = 1/5
Maximizar v2(p*,q) = (4 3p*) + (5p* - 4)q
con 0 q 1
*
v2(p ,q) es una funcin lineal con un parmetro (p*) y la pendiente de la recta
es: (5p* - 4)
1
si pendiente (5p* - 4) > 0
si pendiente (5p* - 4) < 0

q* = 0
*
cualquier punto en [0,1] si (5p - 4) = 0
1
si p* > 4/5
si p* < 4/5
q* = 0
*
cualquier punto en [0,1] si p = 4/5
Felipe Peredo R. 49

En la figura vemos que hay tres puntos de interseccin entre los conjuntos de
puntos ptimos, por lo tanto los equilibrios de Nash de estrategias mixtas son
tres:
E1M = (p1*, 1-p1* ; q1*, 1-q1*) = ( 0 , 1 ; 0 , 1 )
E2M = (p2*, 1-p2* ; q2*, 1-q2*) = ( 4/5 , 1/5 ; 1/5 , 4/5 )
E3M = (p3*, 1-p3* ; q3*, 1-q3*) = ( 1 , 0 ; 1 , 0 )
Interpretacin de los equilibrios:
E1M : El hombre (J1) elige siempre su segunda estrategia (Opera) y la mujer
elige siempre su segunda estrategia (Opera), esta solucin coincide con
el equilibrio de Nash (O,O) con pagos (u1 , u2) = (2,4) favorable a J2
M
E3 : El hombre (J1) elige siempre su primera estrategia (Box) y la mujer elige
siempre su primera estrategia (Box), esta solucin coincide con el equilibrio de Nash (B,B) con pagos (u1 , u2) = (4,2) que favorecen a J1 .
M
E3 : El hombre (J1) elige sus estrategias al azar, un 80% el Box y un 20% la
Opera. La mujer elige tambin al azar sus estrategias, un 20% el Box y
un 80% la Opera.
Sus respectivos pagos esperados son v1 = 1.6 , v2 = 1.6 ; esta solucin es
interesante porque an cuando otorga pagos menores d los jugadores,
tiene la ventaja de ser equitativa, a diferencia de las otras dos soluciones.
EL MODELO DE LA SUPERVISIN con un salario alto
Este modelo, descrito en un ejemplo anterior tiene la matriz de pagos:
J2 (jefe)
(u1,u2) =
J1 (empleado)
T
O
Felipe Peredo R. 50
(w , 20-w-4)
(0, 6)
(w , 20-w)
(w+6 , 10-w)
Adems vimos en la seccin If. que, cuando el salario que percibe el empleado
es mayor a 4, el juego no tiene equilibrio de Nash.
Resolver el juego para el salarios w > 4
SOLUCION
Se tiene que usar el mtodo de estrategias mixtas. Escribimos la matriz de
pagos indicando las probabilidades de las estrategias:
J2 (jefe)
S (q)
O (1-q)
(u1,u2) =
J1 (empleado)
T (p)
O (1-p)
(w , 20-w-4)
(0, 6)
(w , 20-w)
(w+6 , 10-w)
Los pagos esperados son: v1 = wpq + wp(1-q) + 0(1-p)q + (w+6)(1-p)(1-q)

simplificando: v1 = (w+6)(1- q) + [(w+6)q 6]p
v2 = (20-w-4)pq + (20-w)p(1-q) + 6(1-p)q + (10-w)(1-p)(1-q)
simplificando: v2 = (10w+10p) + (w4wp)q
Maximizar v1(p,q*) = (w+6)(1- q*) + [(w+6)q* 6]p
con 0 p 1
*
*
v1(p,q ) es una funcin lineal con un parmetro (q ) y la pendiente de la recta
es: [(w+6)q* 6]
Por lo tanto los puntos ptimos p* que maximizan la funcin son:
1
si pendiente (w + 6)q* - 6 > 0
*
si pendiente (w + 6)q* - 6 < 0
p = 0
*
cualquier punto en [0,1] si (w + 6)q - 6 = 0
1
si q* > 6/(w + 6)
si q* < 6/(w + 6)
p* = 0
*
cualquier punto en [0,1] si q = 6/(w + 6)
Felipe Peredo R. 51
Maximizar v2(p*,q) = (10w+10p*) + (w4wp*)q con 0 q 1

v2(p*,q) es una funcin lineal con un parmetro (p*) y la pendiente de la recta
es: (w4wp*)
1
si pendiente (w - 4 - wp*) > 0
*
si pendiente (w - 4 - wp*) < 0
q = 0
*
cualquier punto en [0,1] si (w - 4 - wp ) = 0
1
si p* < (w - 4)/w
si p* > (w - 4)/w
q* = 0
*
cualquier punto en [0,1] si p = (w - 4)/w
Grfica de los puntos ptimos de los dos jugadores:
En la figura vemos que existe un equilibrio de estrategias mixtas:

6
w
w4 4
,
;
,
EM = (p*, 1-p* ; q*, 1-q*) =
w w+6 w+6
w
Los pagos esperados en el equilibrio son:
40
v1* = w , v2* = 20 w w

Teoria de Juegos Capitulo 1b

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Teoria de Juegos Capitulo 1b

Transféré par

Droits d'auteur :

Formats disponibles

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

MODELO DE DOS MERCADOS DE BERTRAND

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Podemos encontrar el punto de equilibrio de los mercados como el equilibrio

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

(a c + bc) (a c + bc) (a c + bc)

a) Si el salario es w 4 , determinar si el juego tiene equilibrio de Nash

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Considerando lo anterior hacemos la maximizacin de u1 por columnas y la de

El juego tiene un equilibrio de Nash: E= (x1* , x2*) = (O,N)

El juego no tiene equilibrio de Nash

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

la longitud de dicho segmento (por ejemplo, en el intervalo 0.5 x 0.75 que

b) Si un consumidor que est en el punto x , elige comprar en la tienda 2,

Por lo tanto las demandas de cada una de las tiendas son:

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Vamos a calcular los precios de equilibrio p1* , p2* del modelo.

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

-(p1*-c) + N[ t(-)(+) + (p2*-p1*) ] = 0

De manera similar, la tienda 2 maximiza su beneficio suponiendo que la

= c + t(-)[++2] , p2* = 2 = c + t(-)[4]

Equilibrio de Nash del modelo de Hotelling:

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Notas sobre la solucin del modelo de Hotelling.

2) Tambin se puede mostrar grficamente cuales configuraciones ,

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

TEMA I g) ESTRATEGIAS MIXTAS

Resumimos los tres casos en la siguiente frmula:

Una funcin lineal con un parmetro k es una funcin lineal en la variable x

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Mtodo para maximizar una funcin lineal f(x) con un parmetro k

3) Expresamos la frmula anterior en trminos de k

Despejando k de las desigualdades:

Ahora trazamos un sistema de ejes coordenados x*-k y marcamos los

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

AQU TERMINAN LOS ANTECEDENTES DEL TEMA Ig

En la seccin Ib vimos que el siguiente juego no tiene equilibrio de Nash:

Si el juego se realiza un nmero grande de veces, no le conviene al jugador 1

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Por un razonamiento semejante, al jugador 2 no le conviene jugar siempre con

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

En la siguiente tabla hemos anotado las probabilidades de las estrategias:

Los pagos esperados son:

si pendiente (1 - 5q*) < 0

Despejando q* en las desigualdades:

cualquier punto en [0,1] si

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

Despejando q* en las desigualdades:

cualquier punto en [0,1] si

Dibujamos la grfica de los puntos ptimos de v2(p*,q) en el mismo diagrama

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

En la figura se observa que el punto de interseccin de los dos conjuntos

Por ultimo, los pagos esperados en el equilibrio son:

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

b) Resolver el juego por el mtodo de estrategias mixtas

v1 = 3pq + 2p(1-q) + 1(1-p)q

Maximizacin de v2(p*,q) = (2-2p*) + (4p*-2)q

MTODOS DE LA TEORA DE JUEGOS Y APLICACIONES A LA ECONOMA

v2(p*,q) es una funcin lineal con un parmetro y la pendiente de la recta es :

si pendiente (4p* - 2) < 0

En la grfica vemos que el equilibrio se localiza en p* = 1 , q* = 1

Por la interpretacin previamente explicada, esto significa que el jugador 1

( s ,t ) = (I , A) y los pagos ptimos son: (u

-(p1-c) + N[ t(-)(+) + (p2-p1*) ] = 0

Maximizacin de v2(p,q) = (2-2p) + (4p*-2)q

Maximizar v2(p,q) = (10w+10p) + (w4wp*)q con 0 q 1