Académique Documents
Professionnel Documents
Culture Documents
Felipe Peredo R. 29
Felipe Peredo R. 30
bP1* + 2P2* = (a + c)
2(a + c)+ b(a + c)
factorizando las expresiones y simplificando:
P1* =
4 b2
(a + c)(2 + b) (a + c)
P1* =
=
(2 b)(2 + b) (2 b)
2(a + c)+ b(a + c) (a + c)
P2* =
=
(2 b)
4 b2
(a + c) (a + c)
Por lo tanto: (P1* , P2*) =
,
es el equilibrio de Nash del
(2 b) (2 b)
modelo de Bertrand.
Ahora vamos a calcular u1* , u2* (conviene usar las ecuaciones (1) y (2))
u1* = u1(P1*,P2*) = (P1* c)( a P1* + bP2*) =
(a + c) (a + c)
(a + c)
u1* =
c a
+b
(2 b) (2 b)
(2 b)
simplificando las expresiones dentro de los parntesis:
Felipe Peredo R. 31
(a + c) (a + c) (a c + bc)
(a + c)
u2 =
=
>0
c a
+b
(2 b) (2 b) (2 b)
(2 b)
Conclusin: en el modelo de Bertrand las dos empresas obtienen ganancias
positivas en el equilibrio de Nash.
*
EL MODELO DE LA SUPERVISIN
Un empleado tiene las opciones de dedicar todo su tiempo laboral a
desempear el trabajo que se le asigna (estrategia T) bien puede dedicar
parte del tiempo laboral a realizar otras actividades que incrementan sus
ingresos(estrategia O).
Por su parte, el jefe inmediato de dicho empleado puede supervisar
frecuentemente al empleado, lo cual tiene un elevado costo (estrategia S),
bien puede no supervisarlo (estrategia N).
Si el empleado es supervisado y se le descubre realizando otras actividades, se
le sanciona no pagndole ese da.
Consideramos la situacin anterior como un juego de dos jugadores, donde el
pago del primer jugador (el empleado) es su ingreso, mientras que el pago del
segundo jugador (el jefe) es proporcional al beneficio de la empresa.
Los pagos correspondientes a cada combinacin de estrategias se muestran en
el cuadro siguiente, donde w es el salario por da del empleado.
J2 (jefe)
(u1,u2) =
J1 (empleado)
T
O
(w , 20-w-4)
(0, 6)
(w , 20-w)
(w+6 , 10-w)
Felipe Peredo R. 32
T
O
Max u1
(w , 20-w-4)
(0, 6)
w
20-w
(w+6 , 10-w) 10-w
w+6
Max u2
(w , 20-w)
T
O
(w , 20-w-4)
(0, 6)
w
N
20-w
(w+6 , 10-w) 6
w+6
Max u2
(w , 20-w)
Felipe Peredo R. 33
Felipe Peredo R. 34
q1 = N(x* - 0)
p p1
+
]
+ 2
2
2t( )
Donde N > 0 es una constante conocida
q2 = N(1 - x*)
p p1
+
)]
q1 = N[ 1 (
+ 2
2
2t( )
5) las tiendas 1 y 2 tienen costos proporcionales a las cantidades que venden:
CT1 = cq1 , C T2 = cq2
q1 = N x* = N[
2
2t( )
d u1(p1 ,p*2)
=
=0
d p1
d p1
Desarrollando la derivada:
p*2 p1
1
+
+
N(p1-c)
+ N[
](1) = 0
2t( )
2
2t( )
1
Multiplicando toda la ecuacin por 2t(-):
N
Felipe Peredo R. 35
2
2t( )
d u2(p*1 ,p2)
=0
=
d p2
d p2
Desarrollando la derivada:
p2 p*1
1
+
N(p2-c)
+ N[1](1) = 0
2t( )
2
2t( )
1
Multiplicando toda la ecuacin por 2t(-):
N
*
-(p2 -c) + N[2t(-)- t(-)(+) + (p2*-p1*) ] = 0
transponiendo trminos:
-p1* + 2p2* = 2t(-) -t(2-2) + c ..(2H)
Las ecuaciones (1H) y (2H) forman un sistema de dos ecuaciones lineales con
dos incgnitas. Aplicando la regla de Cramer, obtenemos la solucin:
2 1
=41=3
=
1 2
1 =
{t( )+ c }
{2t( ) t(
2
2)+ c
2
2
2
2
1 = 2{t( - )+c} + {2t(-)-t( -2) + c } = 3c + 2t(-) +t(2-2)
2 =
{t( )+ c }
{2t( ) t(
2
2
1
2)+ c
2 = 2{2t(-)-t(2-2) + c }+{t(2-2)+c} = 3c + 4t(-) -t(2-2)
p1* =
1
1
1
3
3
E = (p1* , p2*) = ( c +
1
3
t(-)[++2] , c +
1
3
Felipe Peredo R. 36
t(-)[4] )
Felipe Peredo R. 37
Vamos a estudiar dos mtodos para resolver juegos finitos de dos jugadores
que no tienen equilibrio de Nash. En primer lugar se revisar un mtodo para
maximizar funciones lineales con un parmetro, despus estudiaremos el
mtodo grfico para resolver juegos en los cuales cada jugador tiene dos
estrategias, y por ltimo veremos un mtodo para resolver juegos finitos en un
nmero cualquiera de estrategias para cada jugador.
ANTECEDENTE
Se determinar el punto ptimo x* en el cual una funcin lineal f(x) = a + bx
definida en el intervalo cerrado 0 x 1 tiene su valor mximo.
Las siguientes grficas ilustran grficamente la localizacin del punto ptimo
en tres situaciones posibles (dependiendo del signo de la pendiente de la recta
y = a + bx)
x* = 0
si pendiente b < 0
cualquier punto en [0,1] si pendiente b = 0
Felipe Peredo R. 38
*
x = 0
si pendiente b < 0
cualquier punto en [0,1] si pendiente b = 0
x* = 0
si pendiente (3k - 1) < 0
cualquier punto en [0,1] si (3k - 1) = 0
*
x = 0
si k < 1/3
cualquier punto en [0,1] si k = 1/3
Felipe Peredo R. 39
Ahora dibujamos los puntos (x*,k) que corresponden a cada caso: los puntos
de los casos k > 1/3 , k < 1/3 son segmentos verticales, mientras que los
puntos del tercer caso se encuentran en un segmento horizontal:
A
B
M
(0 , 1)
(4 , 2)
N
(2, 0)
(1, 3)
Felipe Peredo R. 40
Prob
A (.30)
B(.70)
M(.60)
(0 , 1) .18
(4 , 2) .42
N(.40)
(2, 0) .12
(1, 3) .28
Podemos estimar el pago total y el pago promedio que obtendr cada jugador
despus de 100 repeticiones del juego:
u1T = 18veces(pago 0) + 12(2) + 42(4) + 28(1) = 220
u
18
12
42
28
(0) +
(2) +
(4) +
(1) = 2.20
u1promedio = 1T =
100 100
100
100
100
u2T = 18veces(pago 1) + 12(0) + 42(2) + 28(3) = 186
u
18
12
42
28
(1) +
(0) +
(2) +
(3) = 2.20
u1promedio = 1T =
100 100
100
100
100
Notacin: llamaremos pago esperado v1 al pago promedio del primer jugador
y pago esperado v2 al pago promedio del segundo jugador
En general, cuando las probabilidades son p, (1-p), q, (1-q) y los pagos son
u1( si , tj ) = a ij los pagos del 1er jugador
u2( si , tj ) = bij los pagos del 2do jugador
entonces los pagos esperados estn dados por:
v1 = a11pq + a12p(1-q) + a21(1-p)q + a22(1-p)(1-q)
v2 = b11pq + b12p(1-q) + b21(1-p)q + b22(1-p)(1-q)
Felipe Peredo R. 41
Definiciones.
1) Se le llama Estrategia Mixta (p, 1-p ; q, 1-q) a una asignacin de
probabilidades a cada una de las estrategias de los jugadores
2) Un Equilibrio de Nash de estrategias mixtas EM = (p*, 1-p* ; q*, 1-q*)
es una estrategia mixta que maximiza el pago esperado de cada jugador
suponiendo que el otro jugador eligi sus probabilidades de equilibrio.
Es decir que, para encontrar EM :
-Se maximiza v1(p,q*) y se maximiza v2(p*,q)
Observacin. Como v1(p,q*) y v2(p*,q) son funciones lineales con un
parmetro definidas en los intervalos cerrados 0p1 , 0q1 respectivamente
para maximizarlas hay que aplicar el mtodo de los puntos ptimos estudiado
en los antecedentes.
CALCULO DEL EQUILIBRIO CON ESTRATEGIAS MIXTAS para juegos
de 2 jugadores de 22
1. Escribimos las probabilidades de las estrategias individuales (p, 1-p) en el
margen izquierdo de la matriz de pagos; (q, 1-q) en el encabezado de la
matriz de pagos.
2. Desarrollamos y simplificamos las funciones de pagos esperados de los
jugadores: v1 y v2 . Conviene factorizar p en la frmula de v1 y factorizar q
en la frmula de v2 .
3. Se efectan las maximizaciones de v1(p,q*) y de v2(p*,q) , representando
grficamente los puntos ptimos (p*,q*) de cada una de las funciones en un
mismo sistema de coordenadas.
4. Las probabilidades p*, q* del equilibrio quedarn determinadas en la
interseccin de las dos grficas de puntos ptimos.
Ejemplo 2
Calcular el equilibrio de Nash de estrategias mixtas del siguiente juego y los
pagos esperados correspondientes.
J2
(u1,u2)=
J1
SOLUCION
A
B
M
(0 , 1)
(4 , 2)
N
(2, 0)
(1, 3)
Felipe Peredo R. 42
Prob
A (p)
B(1-p)
M(q)
(0 , 1) pq
(4 , 2) (1-p)q
N(1-q)
(2, 0) p(1-q)
(1, 3) (1-p)(1-q)
*
cualquier punto en [0,1] si (1 - 5q ) = 0
si q* > 1/5
p* = 0
q* = 1/5
Felipe Peredo R. 43
Segunda maximizacin:
con 0 q 1
Maximizar v2(p*,q) = (3-3p*) + (-1 + 2p*)q
*
*
Como p es constante, v2(p ,q) es una funcin lineal con un parmetro (p*) y la
pendiente de la recta es: (-1 + 2p*)
Por lo tanto los puntos ptimos q* que maximizan la funcin son:
1
si pendiente (-1 + 2p*) > 0
*
si pendiente (-1 + 2p*) < 0
q = 0
*
cualquier punto en [0,1] si (-1 + 2p ) = 0
si p* < 1/2
q* = 0
p* = 1/2
Felipe Peredo R. 44
Felipe Peredo R. 45
I (p)
II (1-p)
A (q)
(3 , 2)
(1 , 0)
B (1-q)
(2 , 0)
(0 , 2)
con 0 q 1
Felipe Peredo R. 46
*
cualquier punto en [0,1] si (4p - 2) = 0
Despejando q* en las desigualdades:
1
si p* > 1/2
si p* < 1/2
q* = 0
*
cualquier punto en [0,1] si p = 1/2
Dibujamos la grfica de los puntos ptimos de v2(p*,q) en el mismo diagrama
en el que se dibujaron los puntos ptimos de v1(p,q*) (figura anterior):
Observaciones:
*
*
1 ,u2
) = (3 , 2)
Felipe Peredo R. 47
(u1,u2) = J1 (H)
B
O
(4, 2)
(0, 0)
O
(1, 1)
(2, 4)
SOLUCION
Anotamos las probabilidades de las estrategias de cada jugador:
J2 (M)
(u1,u2) = J1 (H)
B (p)
O (1-p)
(q)
(4, 2)
(0, 0)
O (1-q)
(1, 1)
(2, 4)
Felipe Peredo R. 48
1
si pendiente (5q* - 1) > 0
*
cualquier punto en [0,1] si (5q - 1) = 0
Despejando q* en las desigualdades:
1
si q* > 1/5
si q* < 1/5
p* = 0
*
cualquier punto en [0,1] si q = 1/5
Segunda maximizacin:
Maximizar v2(p*,q) = (4 3p*) + (5p* - 4)q
con 0 q 1
*
v2(p ,q) es una funcin lineal con un parmetro (p*) y la pendiente de la recta
es: (5p* - 4)
Por lo tanto los puntos ptimos q* que maximizan la funcin son:
1
si pendiente (5p* - 4) > 0
*
cualquier punto en [0,1] si (5p - 4) = 0
Despejando q* en las desigualdades:
1
si p* > 4/5
si p* < 4/5
q* = 0
*
cualquier punto en [0,1] si p = 4/5
Felipe Peredo R. 49
En la figura vemos que hay tres puntos de interseccin entre los conjuntos de
puntos ptimos, por lo tanto los equilibrios de Nash de estrategias mixtas son
tres:
E1M = (p1*, 1-p1* ; q1*, 1-q1*) = ( 0 , 1 ; 0 , 1 )
E2M = (p2*, 1-p2* ; q2*, 1-q2*) = ( 4/5 , 1/5 ; 1/5 , 4/5 )
E3M = (p3*, 1-p3* ; q3*, 1-q3*) = ( 1 , 0 ; 1 , 0 )
Interpretacin de los equilibrios:
E1M : El hombre (J1) elige siempre su segunda estrategia (Opera) y la mujer
elige siempre su segunda estrategia (Opera), esta solucin coincide con
el equilibrio de Nash (O,O) con pagos (u1 , u2) = (2,4) favorable a J2
M
E3 : El hombre (J1) elige siempre su primera estrategia (Box) y la mujer elige
siempre su primera estrategia (Box), esta solucin coincide con el equilibrio de Nash (B,B) con pagos (u1 , u2) = (4,2) que favorecen a J1 .
M
E3 : El hombre (J1) elige sus estrategias al azar, un 80% el Box y un 20% la
Opera. La mujer elige tambin al azar sus estrategias, un 20% el Box y
un 80% la Opera.
Sus respectivos pagos esperados son v1 = 1.6 , v2 = 1.6 ; esta solucin es
interesante porque an cuando otorga pagos menores d los jugadores,
tiene la ventaja de ser equitativa, a diferencia de las otras dos soluciones.
EL MODELO DE LA SUPERVISIN con un salario alto
Este modelo, descrito en un ejemplo anterior tiene la matriz de pagos:
J2 (jefe)
(u1,u2) =
J1 (empleado)
T
O
Felipe Peredo R. 50
(w , 20-w-4)
(0, 6)
(w , 20-w)
(w+6 , 10-w)
Adems vimos en la seccin If. que, cuando el salario que percibe el empleado
es mayor a 4, el juego no tiene equilibrio de Nash.
Resolver el juego para el salarios w > 4
SOLUCION
Se tiene que usar el mtodo de estrategias mixtas. Escribimos la matriz de
pagos indicando las probabilidades de las estrategias:
J2 (jefe)
S (q)
O (1-q)
(u1,u2) =
J1 (empleado)
T (p)
O (1-p)
(w , 20-w-4)
(0, 6)
(w , 20-w)
(w+6 , 10-w)
*
si pendiente (w + 6)q* - 6 < 0
p = 0
*
cualquier punto en [0,1] si (w + 6)q - 6 = 0
1
si q* > 6/(w + 6)
si q* < 6/(w + 6)
p* = 0
*
cualquier punto en [0,1] si q = 6/(w + 6)
Segunda maximizacin:
Felipe Peredo R. 51
*
si pendiente (w - 4 - wp*) < 0
q = 0
*
cualquier punto en [0,1] si (w - 4 - wp ) = 0
Despejando q* en las desigualdades:
1
si p* < (w - 4)/w
si p* > (w - 4)/w
q* = 0
*
cualquier punto en [0,1] si p = (w - 4)/w
Grfica de los puntos ptimos de los dos jugadores:
w w+6 w+6
w
Los pagos esperados en el equilibrio son:
40
v1* = w , v2* = 20 w w