Vous êtes sur la page 1sur 20

Universidad Nacional Mayor de San Marcos

Facultad de Ciencias Econ


omicas
n de Juegos Repetidos
Teora y Aplicacio

Gomez Pizarro, Julissa


Gutierrez Ventura, Elizabeth
Jes
us Apari, Kevin
Mezones Ccorimanya, Ghissell
Ruiz Coral, Juan
Sanchez Chiroque, Alejandra

Aula : 215 D
Docente: Wilfredo Bacilio Alarcon

Lima, Per
u - 26 de noviembre de 2015


MARCO TEORICO
1.

Introducci
on

Los juegos empleados a lo largo de este curso, convencionalmente se han resuelto de la siguiente
manera: cada uno anuncia la estrategia que ha seleccionado, de tal manera que se impone una de las
salidas, con la correspondiente distribuci
on de ganancias; aca termina el asunto. Si ninguno de los jugadores rechaza su elecci
on, despues de constatar la de los otros, entonces existe un equilibrio de Nash.
El hecho de que todo se arregla en una sola oportunidad es evidente incomodo, sobre todo si la
salida retenida es sub-
optima. De ac
a se desprende la idea de juegos repetidos, que permitira evitar
semejantes salidas, para el bien de todos. Como no pensar en un proceso de ajuste, con una correcci
on
progresiva de los errores, hasta lograr una salida optima En efecto, y como es frecuente cuando se
desea traducir a una forma matem
atica lo que parece tener un buen sentido, la modelacion de tal
proceso no es evidente, particularmente en el marco de la teora de juegos. Efectivamente, para que la
modelacion pueda determinar cuales son las preferencias racionales, debe precisar la informacion que
tiene cada uno sobre las salidas del juego y tambien sobre el comportamiento de los otros y las reglas
del juego por ejemplo, orden y n
umero de los golpes.
Ahora, puede no existir problemas de aprendizaje en el marco de una informacion completa empleado hasta el presente, en tanto los jugadores tienen una vision de conjunto del juego repetido y de
todas sus etapas posibles y se encuentra, por tanto, en una situacion parecida a la del juego simple en
el cual estos solo tienen que determinar su estrategia optima. De la misma manera existe un equilibrio
de Nash si es cierto que las estrategias retenidas para un juego repetido, en ocasiones denominado
superjuego, no hacen arrepentir a ning
un jugador de la decision tomada.
Sin embargo, incluso si en una situaci
on con informacion completa, ning
un juego repetido difiere
fundamentalmente de juego normal, conviene subrayar que presenta ciertas caracteristicas propias: de
un lado, su n
umero de estrategias aumenta exponencialmente con el n
umero de veces que se repita el
juego y permite vislumbrar una gran diversidad de situaciones; por otro lado tal salida conduce a la
situacion de introducir el concepto de amenaza, que de hecho resalta muy bien el caracter condicional
de las estrategias si el hace esto, yo respondo con aquello, pero tambien condiciona la idea basica del
equilibrio de Nash: toda desviaci
on unilateral por parte de un jugador implica una sancion por parte
de los otros, o de algunos de ellos, sin que se tenga que recurrir a una instancia externa

2.

Definici
on

Los juegos repetidos, son una familia particular de juegos dinamicos con una estructura temporal
simple, consistente en que durante varias etapas determinados jugadores( los mismos en cada etapa)
completan un determinado juego, siempre el mismo, llamado tambien juego de etapa(stage-game),
haciendose p
ublicos los resultados y recibiendo cada jugador sus pagos tras cada etapa1
Observaci
on 1
Debe entenderse que una situaci
on con estas caractersticas no es una mera acumulaci
on de juegos
sueltos, sino que constituye un juego complejo en el que las jugadas en las etapas posteriores se pueden
hacer depender de como se jug
o en etapas anteriores y, en consecuencia, las jugadas en una etapa
determinada pueden decidirse seg
un sus consecuencias en etapas posteriores.
1

Teora de Juegos; Cerda,Joaqun & Perez Jose Jimeno; Capitulo 7; 2004; Pearson Educaci
on

3.

Campo de aplicaci
on

Debido a que las interacciones sociales y economicas repetidas son muy habituales e importantes,
es logico pensar que su modelaci
on mediante juegos repetidos puede ser fructfera para comprender
ciertos aspectos importantes de la realidad economica y social.
Mediante los juegos repetidos se pretende modelar aquellas relaciones economicas, polticas, sociales,
etc., a las que los individuos se enfrentan de un modo repetido o rutinario, como por ejemplo la
competencia entre vendedores, las negociaciones sindicales, o cualquier otro tipo de relacion en la que
los mismos agentes tienen que enfrentarse o negociar entre s, no de un modo u
nico sino en distintos
momentos del tiempo y de una forma repetitiva.

4.

Factor descuento

Como en el tema de los juegos repetidos se toma en cuenta el horizonte temporal es importante
evaluar que en un juego la valoraci
on de los resultados en distintos periodos del tiempo es diferente.
Los agentes econ
omicos prefieren disponer del dinero en una fecha cercana que en una lejana. Esta
preferencia por el ahora frente al ms tarde cabe atribuirla esencialmente a dos razones o factores.
La primera radica en la seguridad del presente frente a la incertidumbre del futuro .En virtud de esta
razon, ning
un agente presta dinero a una operacion economica arriesgada si no recibe como promesa
de pago futuro una cantidad sustancialmente mayor que la que presto, de modo que se compense el
riesgo de que la promesa no se cumpla. Se le simboliza con
La segunda raz
on procede del hecho de que disponer ahora del dinero nos da mas oportunidades de
actuacion que disponer de el en el futuro, aunque sea seguro que esa promesa de disponibilidad futura
se va a cumplir. Se le simboliza con r (costo de oportunidad)
Factor descuento de un jugador : factor de descuento es el valor, en unidades de pago actuales, de una unidad de pago que se hara efectiva un periodo mas tarde.
1
=
1+r
dos casos extremos.
= 0: El agente solo valora el presente (impaciencia extrema)
= 1: En este caso el agente valora en igual medida el futuro que el presente (paciencia extrema)
Observaci
on 2
Recordemos la f
ormula de la suma de los terminos de una progresion geometrica de razon y primer
termino igual a la unidad, pues nos ser
au
til en las discusiones que siguen.
Dada la sucesion geometrica {gt }t=1,2,3,... donde gt = t1 , asimismo, la suma de sus primeros T terminos viene dada por:
T
X

t1 =

t=1

1 t
1

la suma infinita, dado que 0 < < 1 es:

X
t=1

5.

t1 = lm

T
X
t=1

t1 =

1
1

Horizonte Finito

Es un juego din
amico en el que un juego simultaneo (juego de etapa) se juega un n
umero finito de
veces y los resultados de cada etapa son observados antes de la siguiente
para el juego en etapa G = {A1 , ..., An, ; g1 , ..., gn } se dice que a las estrategias puras (a las que
llamaremos acciones), a las estrategias mixtas y a las funciones de pagos o ganancias del jugador i las
denotaremos ai , i , gi respectivamente.

Para el juego repetido o global (GT ()) a las estrategias puras, a las estrategias mixtas y a las
funciones de pagos o ganancias del jugador i las denotaremos si , i , ui respectivamente.
Tenemos un vector de factores de descuento = (1 , 2 , ..., n ) que para todos los jugadores son
iguales a 1.
Se toma en cuenta que antes de que empiece el juego se dice que es dominio p
ublico, y en los juegos
de etapa se dice que antes de que comience cada etapa las jugadas realizadas en etapas anteriores son
de dominio p
ublico.

5.1.

caso I

El juego repetido tiene un u


nico ENPS si el juego de etapa (el juego simultaneo) tiene un u
nico
EN.
Sea G un juego en forma estrategica.
Si G tiene un u
nico equilibrio de Nash, entonces para cualquier T finito y cualquier factor de descuento el juego repetido T () tiene un u
nico ENPS, que consiste en que cada jugador juegue de
manera incondicionada en cada etapa su u
nica estrategia de equilibrio.
Si todos los equilibrios de Nash de G resultan en los mismos pagos, entonces para cualquier T finito
y cualquier factor de descuento , cualquier ENPS del juego repetido T () prescribe que en cada
etapa se juegue un EN del juego de etapa G.
Caractersticas del juego
Dos jugadores juegan el mismo juego simultaneo dos veces, en t = 1 y en t = 2
El resultado de la primera vez que se juega (de t = 1) es observado antes de jugarlo una segunda
vez.
El pago del juego repetido es la suma de los pagos en cada jugada (t = 1, t = 2).
Se juega con el fin de que vaya apareciendo la conducta de cooperacion o colusion para obtener
mayores beneficios.
Como se observa en el la figura, es un juego repetido en dos etapas en la que los pagos totales se
muestran en los nodos finales.

Figura 1:

Elementos del juego:


El juego presenta cinco conjuntos de informacion, en la primera etapa presenta un solo conjunto de
informacion y en la segunda etapa presenta cuatro conjuntos de informacion. Existe 5 subjuegos,
cuatro en la segunda etapa y el juego completo.

Para dar soluci


on a estos tipos de juegos primero se tienen que encontrar los equilibrios de Nash de
cada subjuego para as podar las ramas del arbol luego, una vez jugado la segunda etapa se prosigue
a encontrar el equilibrio perfecto en subjuegos del juego.
Implicancia: En estos tipos de juegos no es posible mantener la colusi
on y la mejor respuesta ya que
por su estructura temporal fija, es mejor encontrar un equilibrio (Nash) en la que da soluci
on al juego.

5.2.

caso II

Si el juego de etapa tiene 2 o m


as EN, pueden existir ENPS en los que en alguna etapa NO se
juegan estrategias que sean EN sino que se juega algo que es mejor para los dos jugadores.Sea G un
juego en forma estrategica, y sea el juego repetido GT () en donde T es finito.
Cualquier ENPS del juego repetido tiene que dar lugar en la u
ltima etapa a un EN de G. Cualquiera
de los resultados ( (1), (2), ..., (T )), donde cada (k) es un perfil estrategico que es un EN de
G, es un resultado perfecto en subjuegos de GT (). Ademas, el perfil de estrategias = (1 , 2 , ..., n )
consistente en que cada jugador juegue de manera incondicionada en la etapa k-esima la estrategia
que le corresponde en (k) es un ENPS2 .
La exigencia de que todo ENPS determine un EN en la u
ltima etapa es una exigencia logica derivada de
la racionalidad de los jugadores. Todos los jugadores saben cual es la u
ltima etapa. Este conocimiento
hace que dejen de tener sentido todas las amenazas o promesas que se puedan hacer en dicha etapa,
pues no hay turno para las represalias y castigos en caso de incumplimiento. No existiendo posibilidad
de penalizaciones futuras, en la u
ltima etapa cada jugador se comportara tal y como se comportara
si el juego tuviese una u
nica etapa, es decir, jugando una estrategia que determine para el conjunto
de los jugadores un EN en dicha etapa.

6.

Horizonte Infinito

Los mismos jugadores juegan el mismo juego G periodo tras periodo. Tras cada periodo observan
el resultado obtenido por ambos (y el vector de acciones elegidas).
G: juego constituyente o de etapa
G(T): juego repetido con horizonte temporal T
La conducta estrategica en G(T) puede ser muy diferente a la conducta en G. En particular, si
G es un dilema de los prisioneros, Bajo que condiciones puede obtenerse cooperacion entre jugadores
egostas en G(T)?

Problema: como evaluar una corriente o flujo de pagos?


Mediante la suma de su valor presente o descontado, es decir, su valor en euros de t = 1
Factor de descuento de un jugador, , es el valor presente (euros de t = 1) de un euro que se
obtendra ma
nana (en t = 2).
1
Si el tipo de interes es r, entonces: =
1+r
Luego, 0 < < 1
Si tiende a 1, entonces el futuro importa bastante.
Si tiende a 0, entonces el futuro importa poco.
Ademas del tipo de interes, influyen en el factor de descuento (en tus preferencias intertemporales)
otros aspectos como los gustos, la probabilidad de continuar activo en el juego, etc.
Horizonte temporal:
2

Teora de Juegos; Cerda,Joaqun & Perez Jose Jimeno; Capitulo 7; 2004; Pearson Educaci
on

- finito: existe una fecha lmite que es conocimiento p


ublico entre los jugadores.
- infinito: no existe tal fecha lmite conocida de antemano. En cada periodo existe una probabilidad
positiva de volver a jugar el siguiente periodo.

Estrategia de un jugador en G(T):


Es una regla o plan que especifica que accion adoptar en cada periodo como funcion de cada posible
historia previa del juego. La historia del juego en t es la secuencia de pares de acciones observadas
hasta t 1.
Dos estrategias de cooperaci
on condicional son:
Estrategia del disparador
Empiezo cooperando en t = 1, y luego coopero si siempre se coopera antes pero si en alg
un periodo
alg
un jugador no coopera paso a no cooperar para siempre (tras toda historia).
Observese que la longitud del castigo no depende de la conducta del otro en el castigo
Estrategia del Talin o de Toma y Daca: Empiezo cooperando y luego juego lo que jug
o mi
oponente en el periodo anterior.

Ejercicio 1.1 Dilema del prisionero general


Considere el siguiente DP simetrico:
C
c,c
a,b

C
NC

NC
b,a
n,n

donde a > c > n > b


En el juego repetido con horizonte infinito se puede obtener cooperacion mediante estrategias de
disparador si se cumple:
c
.n
a+
(1 )
(1 )
donde es el factor de descuento de ambos jugadores. Luego
0

(a c)
(a n)

Si los jugadores siguen la estrategia de Toma y Daca (TD), entonces ademas de la misma desviaci
on
que con la estrategia del Disparador (NC) en t = 1 y luego NC para siempre), existe otra posible
desviacion: NC en t = 1 para luego volver a C en t = 2. Para que esta desviacion no sea provechosa
debera cumplirse:
c + .c a + .b
que implica
=

(a c)
(c b)

Luego, ambos jugadores jugando la estrategia TD es un EN del DP con horizonte infinito si:
0

max { , }
Que factores favorecen la cooperaci
on?
1. Altos factores de descuento y altas probabilidades de continuacion.
2. Bajas ganancias netas por traicionar la cooperacion, a - c.
3. Altas ganancias individuales cuando todos los jugadores cooperan: c. Bajas ganancias individuales
cuando todos no cooperan: n

EJEMPLO 1
7.

Juegos repetidos con horizonte finito

7.1.

Juego de etapa con un u


nico equilibrio de Nash

Supongamos el siguiente juego simult


aneo G como juego de etapa:
J1 / J2
A
B

C
4,4
5,1

D
2,2
2,3

E
-1,-1
-1,-1

Consideremos la repetici
on de dos periodos del juego G, donde al final de cada periodo los jugadores consiguen la informaci
on de cada periodo y sus pagos son la suma de los pagos por periodo. En
otras palabras, el factor de descuento es igual a la unidad ( = 1).
Cuando este juego simult
aneo se juega una sola vez (T=1), comprobamos que existe un u
nico
equilibrio de Nash (B,D) con pagos (2,3)
J1 / J2
A
B

C
4,4
5,1

D
2,2
2, 3

E
-1,-1
-1,-1

No obstante, la acci
on (A,C) proporciona unos pagos mayores (4,4) al pago otorgado por (B,D) pero
no es un Equilibrio de Nash.
Para Jugador 1:
si el jugador 2 elige C
U1 (B) > U1 (A)
si el jugador 2 elige D
U1 (B) U1 (A)
si el jugador 2 elige E
U1 (B) U1 (A)
Para Jugador 2:
si el jugador 1 elige A
U2 (C) > U2 (D) > U2 (E)
si el jugador 1 elige B
U2 (C) > U2 (D) > U2 (E)

Como podemos observar, el jugador 1 presenta un dilema del prisionero debido a que la estrategia
B es dominante lo que impide que el jugador 2 coopere.
Si inducimos que el jugador 2 coopere, es decir qu juegue C, esto solo se cumplira en el primer
periodo (T=1) y no en el siguiente periodo (T=2) debido a que no es un equilibrio del juego.
La u
nica forma de que ambos jugadores cooperen es mediante la amenaza de un castigo futuro pero
no se cumple en el u
ltimo periodo porque ya no existe futuro. Por lo tanto, para cualquier equilibrio
de Nash de un juego repetido con horizonte finito, en el periodo T=2 se debe jugar un equilibrio de
Nash.
Por ejemplo, suponemos que el jugador 2 incorpora dicho castigo y decide cooperar, a continuaci
on
conoceremos las estrategias para cada jugador:
Estrategia del jugador 1:
(a) En el primer periodo (T = 1), jugar A.
(b) En el segundo periodo (T = 2), jugar B, tras cualquier historia posible.
Estrategia del jugador 2:
(a) En el primer periodo (T = 1), jugar C.
(b) En el segundo periodo (T = 2), jugar D , si el jugador 1 ha jugado A en T=1.
Y jugar E si el jugador 1 ha jugado B en T= 1.
si el jugador 1 se desva y el jugador 2 se mantiene fijo, tenemos las siguientes estrategias:
Primer periodo (T=1):
J1 / J2
A
B

C
4,4
5, 1

D
2,2
2,3

E
-1,-1
-1,-1

J1 / J2
A
B

C
9,5
10,2

D
7,3
7,4

E
4,0
4, 0

Segundo periodo (T=2):

El jugador 1 en el primer periodo, obtiene un pago de 5 pero en u


ltimo periodo el jugador 1 el
pago que recibe disminuye en 1, es decir, obtiene un pago de 4. Por lo tanto, el jugador 1 no tiene
incentivos de desviarse.
Lo mismo ocurre con el jugador 2.
Ante estos posibles escenarios, el u
nico plan creble del jugador 2 es que jugara D en T = 2, sea
cual sea la historia, es decir, lo sucedido en T = 1. Por supuesto, esta ausencia de una amenaza de
castigo creble hace que el jugador 1 no coopere en el periodo anterior, T = 1.
En definitiva, el u
nico equilibrio perfecto del juego repetido lo constituye el par de estrategias :
Estrategia del jugador 1:

(a) En el primer periodo (T = 1), jugar B.


(b) En el segundo periodo (T = 2), jugar B, para cualquier historia.
Estrategia del jugador 2:
(a) En el primer periodo (T = 1), jugar D.
(b) En el segundo periodo (T = 2), jugar D , para cualquier historia .
El equilibrio que da lugar este par de estrategias es la mera repeticion del equilibrio Nash de etapa:
(B,C),(B,C)
Generalizando, para cualquier juego repetido con horizonte finito G(T) con un u
nico equilibrio
de Nash en el juego G, el u
nico equilibrio perfecto viene dado por la repeticion en cada periodo del
equilibrio de Nash del juego de etapa.

8.

Juegos repetidos con horizonte infinito


Consideremos que el siguiente juego de etapa se desarrolla un n
umero infinito de veces:
J1 / J2
A
B

C
1,1
0,5

D
5,0
4,4

El equilibrio de Nash de este juego son las estrategias (A,C) con pagos de (1,1) pero si ambos
cooperan jugaran (B,D) con pagos de (4,4).
J1 / J2
A
B

C
1, 1
0,5

D
5,0
4,4

Entonces, es posible mantener una cooperacion en el tiempo?


Para descubrirlo usaremos la estrategia del gatillo (Tigger Strategy):
(a) cooperar hasta que se produzca una desviacion.
(b) Si se produce la desviacion, jugar no cooperativamente hasta el final.
Si el jugador 1 juega la estrategia del gatillo, gana algo si el jugador 2 se desva en T?
(i) Si no se desva: Tendr
a una secuencia de pagos de (4,4) en el periodo T hasta el infinito,
descontando esos pagos:
4 + 4 + 4 2 + 4 3 + ... =

4
1

(ii) Si no se desva: El jugador 1 jugara A del periodo T+1 en adelante y el jugador 2


responder
a jugando C. Sus pagos seran 5,1,1,1,... Descontando esos pagos:
5 + 1 + 1 2 + 1 3 + ... = 5 +
Ahora, evaluamos ambos casos:

1
1

4
1

5+

1
1

1
4

Por lo tanto la estrategia de gatillo del jugador 2 es mejor respuesta a la estrategia de gatillo del
jugador 1 si 41 .
Lo mismo ocurre para el jugador 1.
En conclusi
on, hay un Equilibrio de Nash en el que ambos juegan las estrategias del gatillo si
14 .

EJEMPLO 2
9.

Un juego de etapa con varios equilibrios Nash


Consideremos la repetici
on de dos periodos del siguiente juego simultaneo 3 .
J1 /J2
C
D
E

P
7,7
8,2
1,2

Q
2,8
5,5
1,1

S
1,2
1,1
2,3

Solucion:

Jugadores:
N = {1,2}

Acciones:
A1 = {C, D, E}
A2 ={P,Q,S}

Estrategias:

Si ={3 39 } = 310 , i = {1, 2}

Notamos que en el juego constituyente existen dos EN:


EN = {(D, Q); (E, S)}
El equilibrio (D, Q) que proporciona unos pagos de (5,5) y el equilibrio (E,S) que proporciona
unos pagos de (2,3) y ninguno de estos EN es eficiente. Como se observa en el resultado eficiente
(cooperativo) es (C, P) con unos pagos (7,7). En este caso, la cooperacion no es posible en el juego
aislado, porque ambos jugadores se desviaran a una accion no cooperativa. Sabemos que en el segundo
3

La tasa de descuento de cada jugador es = 1

y el u
ltimo periodo se jugara un EN del juego de etapa.4
Entonces, podemos sostener en equilibrio perfecto del juego repetido la cooperacion en el primer
periodo?
Pero, se observa que de los dos EN, uno de ellos es mejor que el otro. Es decir, el EN (D, Q) ofrece
mas pagos a ambos jugadores que el EN (E, S).
Lo que permite usar estrategias con premios y castigos crebles que sostienen la cooperacion. Esto
es, si premiamos y castigamos jugando estrategias que sean EN.
Premio: Jugar (D,Q)
Pagos : (5,5)
Castigo: Jugar (E,S)
Pagos : (2,3)
Las estrategias que formaran dicho equilibrio perfecto son las siguientes:
I. Estrategia del jugador 1:
a) En el primer periodo, t = 1, jugar C
b) En el segundo periodo, t=2, jugar D, si en t=1 se ha jugado (C,P).
Y jugar E, si en t=1 se ha jugado otra opcion.
II. Estrategia del jugador 2:
a) En el primer periodo, t=1, jugar P
b) En el segundo periodo, t=2, jugar Q, si en t=1 se ha jugado (C, P).
Y jugar S, si en t=1 se ha jugado otra opcion.
Por tanto, en cada subjuego de t=2, o se juega la estrategia (D,Q) o se juega la estrategia (E,S)
generando un EP en el primer periodo en el que se juegan acciones que no forman un EN del juego
de etapa.
Por induccion hacia atr
as, sustituimos los subjuegos por sus pagos en EN. El juego en forma Normal
que resulta tiene (C,P) como jugada en EN.
J1 /J2
C
D
E

P
12,12
10,5
3,5

Q
4,11
7,8
3,4

S
3,5
3,4
4,6

Analizando el juego por etapa:


Las estrategias mencionados anteriormente, formaran un EN porque
- Si mantenemos fija la estrategia C del J1, si el J2 se desva a Q
en t=1 obtiene un pago de 8 en ese periodo, pero un pago de 3 en el
segundo periodo, obteniendo un pago total de 11.Para que no se desvie:
7 + premio > 8 + castigo , esto es : 7 + 5 > 8 + 3.
Por ello, el J2 no tiene incentivos a desviarse.
J1 /J2
C
D
E
4

P
7,7
8,2
1,2

Ver Figura 2. Representaci


on en forma extensiva (Informal).

Q
2,8
5,5
1,1

s
1,2
1,1
2,3

- Ahora, si mantenemos fija la estrategia P del J2 y el J1 se desva a D


en t=1 obtiene un pago de 8 en ese periodo, pero un pago de 2 en el
segundo periodo, obteniendo un pago total de 10. Para que no se desve
7 + premio > 8 + castigo , esto es : 7 + 5 > 8 + 2.
Por ello, el J1 no tiene incentivos a desviarse.

J1 /J2
C
D
E

P
7,7
8,2
1,2

Q
2,8
5,5
1,1

S
1,2
1,1
2,3

Entonces se deduce que es un equilibrio perfecto porque esta basado en la amenaza creble de jugar
en el segundo periodo el EN inferior en pagos en vez del EN superior en pagos, para disuadir a los
jugadores de que se desven para obtener 8 en lugar de 7 en el primer periodo.
Esta es una amenaza creble porque (B,R) es un EN del juego de etapa. Luego, la existencia de un
EN del juego de etapa que Pareto domina a otro EN permite construir castigos crebles que sostienen
la cooperacion aunque el horizonte sea finito.
Cabe resaltar que este no es el u
nico EP de este juego repetido. En conclusion, para este juego
repetido,las siguientes
sendas tambien seran sendas de EP: (D,Q),(D,Q),(E,S),(E,S),(E,S),(D,Q) o (D,Q),(E,S).
Pero el hecho destacable es que con multiplicidad de equilibrios en el juego de etapa, tambien se
pueden construir un EP del juego repetido con estrategias que dictan acciones que no formen parte
de ning
un EN del juego constituyente.5
Figura 2: Forma Extensiva (Informal)

M aterial Docente. Juegos Repetidos. U niversidad Carlos III, M adrid (2012) : 21 14.
W eb. 18 de noviembre del 2015.

APLICACION:
UN MODELO DE ALIANZA DEPREDACION
10.

INTRODUCCION:

En esta aplicaci
on se presentar
a un modelo de deprecacion con informacion completa, con diferentes factores de descuento de las empresas. Teniendo en cuenta que la estrategia de las empresas son:
Competencia, Alianza y deprecaci
on, que se realizan bajo ciertas condiciones. El modelo inicialmente
se encuentra bajo condiciones simetrico con juego simultaneo repetido.

11.

DEPREDACION

Es la practica de desplazar a rivales mediante la reduccion de precios por debajo del costo de
produccion y con ello eliminando a la competencia. El depredador una vez eliminado al rival buscara cobrar rentas monop
olicas, relativamente grandes para recuperar las perdidas de la campa
na
predatoria. Tengamos en cuenta que la empresa predadora no esta compitiendo pues sacrifica ganancias vendiendo a precios no-econ
omicos para desplazar al competidor y as cobrar rentas monopolicas.
Definiendo:

J = {J1; J2}
Ai = {Dep; Com}

i = A, B

Ahora representamos los pagos de las acciones:


Si ambas empresas toman acciones predatorias contraen perdidas iguales al costo fijo: F
Si las empresas deciden competir obtienen beneficios no negativos : c
En el caso que una empresa decida depredar y la otra competir, la primera recibe perdidas iguales a
sus costos fijos y la segunda empresa sale del mercado con beneficios nulos, para los siguientes periodos
la empresa depredadora obtiene beneficios monopolicos (M ).
Nota: Utilizando factor de descuento de juegos repetidos con horizonte infinito.
Bi : Factor de descuento
r: Tasa de interes
1
B=
1+r

0 < Bi < 1
0<r<1

X
i=1

i = A, B

1
1 2
1 n
1 i
) =(
)+(
) + ... + (
)
1+r
1+r
1+r
1+r

i = + 2 + ... + n

i=1

X
i=1

i =

Analizaremos los beneficios (i ) de la empresa depredadora llevada al presente:

i = F + M () + M ()2 + .. + M ()n
i = F + (
i =

)(m )
1

(F )(1 ) + (m )
1

i (1 ) = (F )(1 ) + (m )
i = (F )(1 ) + (m )

(1)

Los pagos del juego mencionado se describe en la siguiente matriz:


Cuadro 1

A\B
Dep
Comp

Dep
-F , -F
0, (1 B (F ) + B m )

Comp
(1 A (F ) + A m ), 0
c , c

Los equilibrios de Nash depender


an de las condiciones presentadas por los valores F , c , m , A , B .
Para cada equilibrio presentado se debe cumplir lo siguiente:

Por ejemplo,Comp/Comp es el u
nico equilibrio de Nash si se impone dos restricciones. Como se
puede observar la siguiente ecuaci
on es importante porque restringe a la estrategiaComp/Dep:

c > (1 i )(F ) + i (m )
c > F + i (F ) + i (m )
c + F > i (F + i )
c + F
> i
m + F

i = A, B

(2)

El otro posible equilibrio de Nash que tambien es u


nico en ciertos casos es Dep/Comp. Esto
sucede cuando se supone las siguientes restricciones:
(1 A )(F ) + A (m ) > c

c > (1 B )(F ) + B (m )

F + A (F ) + A (m ) > c

c > F + B (F ) + B (m )

A (F + m ) > c + F
A >

c + F
m + F

c + F > B (F + m )
y

c + F
> B
m + F

(3)

Un tercer caso Com/Dep,es un caso analogo a las condiciones presentadas en el perfil de estrategia anterior y por lo tanto las condiciones seran:

B >

c + F
m + F

c + F
> A
m + F

(4)

Podemos afirmar, por lo tanto que existen 3 equilibrios de Nash u


nicos, cuando los i (F actordeDescuento)
son bajos se presenciar
a competencia en las empresas, si una empresa tiene i alto y la otra empresa
tiene dicho factor bajo, se presentar
a por parte de la primera empresa acciones predatorias y por la
otra parte la segunda empresa tomar
a decisiones de competencia y por u
ltimo caso si las dos empresas
tienen i altos, los resultados son inciertos y surgira una posible guerra de desgaste. 6

12.

ALIANZA

En esta secci
on analizaremos a los acuerdos implcitos que sostienen las empresas competidoras,
ya sea para fijar o aumentar los precios o reducir la produccion para poder aumentar las ganancias.
Las decisiones de las empresas de produccion y precio estan en funcion de las empresas competidoras,
toman en cuenta las acciones de sus rivales y coordinan sus acciones.
Los incentivos son mayores si las empresas producen productos homogeneos.
Definiendo:

J = {J1; J2}
Ai = {Comp; Al}

i = A, B

Ahora representamos los pagos de las acciones:


Si las empresas Ay B deciden aliarse (Al), esto generara que los beneficios monopolicos se repartiran
en la mitas (m /2).
En la situacion en la cual al empresa A decide competir y la empresa B aliarse, es la sircunstancia en
la cual la empresa A decide desviarse del acuerdo de alianza para obtener beneficios monopolicos el
primer periodo, por lo cual la empresa B contrae perdidas iguales al costo fijo (F) en dicho periodo.
Luego del desvi
o de la empresa A, la empresa B decide castigarla pasando a tener comportamiento
competitivo. En el caso mencionado las empresas A y B tienen los siguientes beneficios intertemporales
promedios:

guerra de desgaste - Aqu


dos o mas empresas pelean un monopolio, para ello pueden,
inician todo tipo de juegos, pueden hacer guerras de precios, y son de desgaste, ya que hasta
que uno se desgasta y decide abandonar, el otro gana.
6

A = m + c (A ) + c (A )2 + .. + c (A )n
A = m + (

A =

B = F + c (B ) + c (B )2 + .. + c (B )n

A
)(m )
1 A

B = F + (

(m )(1 A ) + A (c )
1 A

B =

A (1 A ) = (m )(1 A ) + A (c )

A = (m )(1 A ) + A (c )

B
)(c )
1 B

(F )(1 B ) + B (c )
1 B

B (1 B ) = (F )(1 B ) + B (c )

B = (F )(1 B ) + B (c )

(5)

Por el contrario si la empresa A trata de aliarse y la empresa B es la que se desva, los pagos ser
an
analogos a los presentados en el anterior caso:
A = (F )(1 A ) + A (c )

B = (m )(1 B ) + B (c )

(6)

Los pagos del juego mencionado se describe en la siguiente matriz:

Cuadro 2

A\B
Dep

Comp
c , c

Comp

((1 A )(F ) + A c ) ,

Al
(1 A )(m ) + A c ,
(1 B )(F ) + B c
m m
,
2
2

((1 B )(m ) + B c )

Como en la secci
on anterior, los equilibrios de Nash dependeran de las condiciones presentadas por los
valores F , c , m , A , B . Para cada equilibrio presentado se debe cumplir lo siguiente:
Un posible equilibrio de Nash que es u
nico en ciertos casos es Comp/Comp. Esto sucede cuando se supone las siguientes restricciones:
m
< (1 i )m + i c
2
m
< m i m + i c
2
i (m c ) <
m
2
i <
(m c )

m
2

i = A, B

(7)

Este caso Com/Dep,es un caso analogo a las condiciones presentadas en el perfil de estrategia
anterior y por lo tanto las condiciones seran:
m
2
i >
(m c )

i = A, B

(8)

Podemos afirmar que existen 2 equilibrios de Equilibrio de Nash u


nicos, si los
i (f actoresdedescuento) son relativamente bajos se presenciara competencia entre las empresas. Por
otra parte se realizar
a la Alianza si y solo s los factores de descuento son relativamente altos.

13.

Depredaci
on y Alianza

En este modelo, fusionaremos los dos casos desarrollados previamente. Ahora cada empresa (A y
B) tiene tres posibles estrategias las cuales son: Aliarze, Depredar y Competir. A la vez tomando en
cuenta el factor de descuento que tiene cada una de las empresas, ya que sus acciones dependen de ello.
La matriz de beneficios intertemporales promedio del juego, es la integracion de las matrices anteriores, analizados de manera independiente; ademas se agrega dos relaciones mas que son Depre/Aliar
y Aliar/Depre.
Para lo cual es necesario hacer un supuesto para su desarrollo : cuando una empresa depreda y la
otra intenta aliarse, el resultado seria que depredador obtendra el beneficio i = (1 i )(F ) + i i
mientras que la presa obtiene una perdida igual costo fijo F en el primer perodo, y despues abandona el mercado.

A\B
Dep

Dep
-F,-F

Cuadro 3
Comp
(1 A (F ) + A m ), 0

Comp

0, (1 B (F ) + B m )

c , c

Al

(1 A (F ),

(1 A )(F ) + A c ),

(1 B )(m ) + B c

(1 B )(F ) + B m )

Al
(1 A )(F ) + A m ),
(1 B (F )
(1 A )(m ) + A c ,
(1 B )(F ) + B c
m m
,
2
2

Ahora hallaremos los equlibrios del juego,para lo cual se nesecita hacer restricciones que ayudara
a probar que son equlibrios de Nash.

Por ejemplo,Comp/Comp es el u
nico equilibrio de Nash si se impone dos restricciones.
Como se puede observar la siguiente ecuacion es importante porque restringe a la estrategiaComp/Dep:
c > (1 A )(F ) + A M
c+F > A (F + M )
A <

c + F
F + M

(9)

Esta siguiente ecuaci


on restringe que Al/Alsea un equilibrio de Nash.
M
2

< (1 i )M + i c

i <

M
2

M c

, i = A, B

(10)

Los resultan son claros, ya que implican que solo puede haber competencia si ambas empresas
tienen factores de descuento lo suficientemente bajos.
El otro posible equilibrio de Nash que tambien es u
nico en ciertos casos es Dep/Comp. Esto
sucede cuando se supone las siguientes restricciones:
(1 A )(F ) + A M > c
A (F + M > c + F
A >

c + F
M + F

(11)

(1 B )(F ) + B M < c
B (F + M ) < c + F
B <

M
2

c + F
M + F

(12)

< (1 B )M + B c
B <

M
2

M c

(13)

En este caso implican que habr


a depredacion cuando una empresa tiene un factor de descuento relativamente alto y la otra tiene un factor de descuento relativamente bajo.
Un tercer caso Com/Dep,que es la inversa del caso anterior, es el u
nico equilibrio de Nash si
se da lo siguiente:

A <

c + F
M + F

(14)

B >

c + F
M + F

(15)

A <

M
2

M c

(16)

La empresa competidora terminara desplazada del mercado por la depredadora, debido a los menores costos que incurrir
a en el presente y por tener un factor de descuento alto.

Sin embargo, si ambas empresas tienen factores de descuento relativamente altos, aparecen m
ultiples equilibrios posibles. Es relevante mostrar un caso particular en el cual la alianza Ali/Ali
es un equilibrio. Para que esto suceda, los factores de descuento no tienen que ser ni muy altos
ni muy bajos. En particular, debe encontrarse en el siguiente rango:
M
2

M
+F
2
> i >
+F
M c

(17)

Si el factor de descuento de la empresa este por debajo del lmite inferior que aparece en la ecuaci
on ,
entonces la empresa preferir
a competir cuando la otra intente aliarse. De lo contrario, cuando el factor
de descuento este por encima del lmite superior, entonces la empresa preferira depredar cuando la
otra trate aliarse.

Conclusiones
i)El modelo de depredaci
on nos muestra que las acciones de una empresa (el depredador) cuando
tiene un factor de descuento relativamente alto y la otra empresa (la presa) cuando tiene un factor
de descuento relativamente bajo. Si esto ocurre, no es necesario hacer ning
un supuesto respecto de la
existencia de asimetras informativas o mecanismos de se
nalizacion para obtener un u
nico equilibrio
de Nash, en el cual el proceso del juego repetitivo, sera donde una empresa depreda y la otra se retira
del mercado.
Cuando ambas empresas tienen factores de descuento relativamente bajos, tambien existe un u
nico
equilibrio de Nash: nadie depreda y hay competencia,osea Com/Com.
ii)En el modelo de depredaci
on y alianza, existen dos conclusiones principales, el primero hay
depredacion cuando una empresa tiene un factor de descuento alto y la otra tiene un factor de descuento
bajo y este equilibrio es u
nico hay competencia cuando ambas empresas tienen factores de descuento
bajos y este equilibrio tambien es u
nico.
iii)Cuando ambas empresas tienen factores de descuento relativamente altos, aparecen equilibrios
m
ultiples y la competencia jam
as sera uno de ellos. Lo que se configura es, en cambio, una guerra de
desgaste en la que cualquiera de las dos empresas depreda, y existe un equilibrio posible en estrategias
mixtas.
2

iv)En el modelo la alianza tambien puede sostenerse como un equilibrio en ciertos casos, pero
aparece la conclusi
on adicional de que los factores de descuento requeridos tienen un lmite superior
y uno inferior.
Si por ejemplo,dicha empresa se encuentra debajo del limite la alianza fracasa, porque las empresas
encuentran mas rentable desviarse del acuerdo de alianza a fin de obtener beneficios monop
olicos
presentes y si se encuentra por encima del lmite superior rompen con la alianza porque las empresas
prefieren incurrir en perdidas presentes a cambio de convertirse en monopolistas futuros, despues de
haber depredado a sus competidores.

BIBLIOGRAFIA

Material Docente. Juegos Repetidos.Universidad Carlos III, Madrid(2012):21-14.Web.18 de


noviembre del 2015.
Emilio Cerda, Joaqun Perez Jose Jimeno. (2004). Teora de Juego. Madrid-Espa
na: Pearson
Educacion S.A.
Universidad Carlos III. (2008). Juegos repetidos. 2009, de Universidad Carlos III Sitio
web:http : //www.eco.uc3m.es/docencia/newj uegos/doc/3,1 %20Repetidos %20f initos.pdf
Robert Gibbons. (1993). Un primer curso de Teora de Juegos. EE.UU: ANTONI BOSCH.
Leandro Zipitra. (2013). Teora de Juegos . 2013, de Universidad de Montevideo Sitio web:
https: //leandrozipitria.files.wordpress.com/2008/12/4-teojuegos.pdf
Jose Antonio Graca Hernandez, Concepcion Reyes de la Cruz. Teora de Juegos y Empresas:
Un modelo de Alianza y Depredacion. 2008 Universidad Juarez Autonoma de Tabasco.

Vous aimerez peut-être aussi