Académique Documents
Professionnel Documents
Culture Documents
El estudio de los juegos ha inspirado a cientficos de todos los tiempos para el desarrollo de
teoras y modelos matemticos. La estadstica es una rama de las matemticas que surgi
precisamente de los clculos para disear estrategias vencedoras en juegos de azar.
Conceptos tales como probabilidad, media ponderada y distribucin o desviacin estndar,
son trminos acuados por la estadstica matemtica y que tienen aplicacin en el anlisis
de juegos de azar o en las frecuentes situaciones sociales y econmicas en las que hay que
adoptar decisiones y asumir riesgos ante componentes aleatorios.
Pero la teora de juegos tiene una relacin muy lejana con la estadstica. Su objetivo no es
el anlisis del azar o de los elementos aleatorios sino de los comportamientos estratgicos
de los jugadores. En el mundo real, tanto en las relaciones econmicas como en las
polticas o sociales, son muy frecuentes las situaciones en las que, al igual que en los
juegos, su resultado depende de la conjuncin de decisiones de diferentes agentes o
jugadores. Se dice de un comportamiento que es estratgico cuando se adopta teniendo en
cuenta la influencia conjunta sobre el resultado propio y ajeno de las decisiones propias y
ajenas.
La tcnica para el anlisis de estas situaciones fue puesta a punto por un matemtico, John
von Neumann. A comienzos de la dcada de 1940 trabaj con el economista Oskar
Morgenstern en las aplicaciones econmicas de esa teora. El libro que publicaron en
1944, "Theory of Games and Economic Behavior", abri un insospechadamente amplio
campo de estudio en el que actualmente trabajan miles de especialistas de todo el mundo.
La Teora de Juegos ha alcanzado un alto grado de sofisticacin matemtica y ha mostrado
una gran versatilidad en la resolucin de problemas. Muchos campos de la Economa
Equilibrio General, distribucin de costes, etc. se han visto beneficiados por las
aportaciones de este mtodo de anlisis. En el medio siglo transcurrido desde su primera
formulacin el nmero de cientficos dedicados a su desarrollo no ha cesado de crecer. Y no
son slo economistas y matemticos sino socilogos, politlogos, bilogos o psiclogos.
Existen tambin aplicaciones jurdicas: asignacin de responsabilidades, adopcin de
decisiones de pleitear o conciliacin, etc.
Hay dos clases de juegos que plantean una problemtica muy diferente y requieren una
forma de anlisis distinta. Si los jugadores pueden comunicarse entre ellos y negociar los
resultados se tratar de juegos con transferencia de utilidad (tambin llamados juegos
cooperativos), en los que la problemtica se concentra en el anlisis de las posibles
coaliciones y su estabilidad. En los juegos sin transferencia de utilidad, (tambin llamados
juegos no cooperativos) los jugadores no pueden llegar a acuerdos previos; es el caso de los
juegos conocidos como "la guerra de los sexos", el "dilema del prisionero" o el modelo
"halcn-paloma".
Los modelos de juegos sin transferencia de utilidad suelen ser bipersonales, es decir, con
slo dos jugadores. Pueden ser simtricos o asimtricos segn que los resultados sean
idnticos desde el punto de vista de cada jugador. Pueden ser de suma cero, cuando el
aumento en las ganancias de un jugador implica una disminucin por igual cuanta en las
del otro, o de suma no nula en caso contrario, es decir, cuando la suma de las ganancias de
los jugadores puede aumentar o disminuir en funcin de sus decisiones. Cada jugador
puede tener opcin slo a dos estrategias, en los juegos biestratgicos, o a muchas. Las
estrategias pueden ser puras o mixtas; stas consisten en asignar a cada estrategia pura una
probabilidad dada. En el caso de los juegos con repeticin, los que se juegan varias veces
seguidas por los mismos jugadores, las estrategias pueden ser tambin simples o reactivas,
si la decisin depende del comportamiento que haya manifestado el contrincante en jugadas
anteriores.
John von Neumann
1903-1957
Oskar Morgenstern
1902-1976
John C. Harsanyi
1920 John F. Nash
1928 Reinhard Selten
1930 En 1944, John von Neumann y Oskar Morgenstern publicaron su libro "Theory of Games
and Economic Behavior" iniciando as la aplicacin de la Teora de Juegos al anlisis
econmico.
En 1994 se concedi el Premio Nobel de Economa a Harsanyi, Nash y Selten por sus
pioneros anlisis del equilibrio en la teora de los juegos no cooperativos.
La estrategia MAXIMIN
Consideremos un juego de suma cero en el que lo que yo gano lo pierde el otro jugador.
Cada jugador dispone de tres estrategias posibles a las que designaremos como A, B, y C
(supongamos que son tres tarjetas con dichas letras impresas). Los premios o pagos
consisten en la distribucin de diez monedas que se repartirn segn las estrategias elegidas
por ambos jugadores y se muestran en la siguiente tabla llamada matriz de pagos. Mis
ganancias, los pagos que puedo recibir, se muestran sobre fondo verde. Los pagos al otro
jugador se muestran sobre fondo rosa. Para cualquier combinacin de estrategias, los pagos
de ambos jugadores suman diez.
MATRIZ DE PAGOS AL OTRO JUGADOR
La estrategia del
otro jugador
La estrategia del
otro jugador
Mi estrategia
B
6
5
4
B
4
5
6
Mi
7
8
3
C
3
2
7
estrategia C
Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo recibir
ocho monedas y el otro jugador recibir dos.
ste es por tanto un juego de suma cero. Se llama juego de suma cero aqul en el que lo
que gana un jugador es exactamente igual a lo que pierde o deja de ganar el otro.
Para descubrir qu estrategia me conviene ms vamos a analizar la matriz que indica mis
pagos, la de fondo verde. Ignoro cul es la estrategia (la tarjeta) que va a ser elegida por el
otro jugador. Una forma de analizar el juego para tomar mi decisin consiste en mirar cul
es el mnimo resultado que puedo obtener con cada una de mis cartas. En la siguiente tabla
se ha aadido una columna indicando mis resultados mnimos.
MATRIZ DE MIS PAGOS
La estrategia del otro jugador
Mi estrategia
mnimos
En efecto,
Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como mnimo obtendr un resultado
de 1.
Si elijo la tarjeta B, puedo obtener 6, 5 o 4, luego como mnimo obtendr 4.
Si elijo la tarjeta C, puedo obtener 7, 8 o 3, luego como mnimo obtendr 3.
De todos esos posibles resultados mnimos, el que prefiero es 4 ya que es el mximo de los
mnimos. La estrategia MAXIMIN consiste en elegir la tarjeta B ya que esa estrategia me
garantiza que, como mnimo, obtendr 4.
Podemos prever la estrategia del otro jugador? Supongamos que el otro jugador quiere
elegir tambin su estrategia MAXIMIN. Mostramos ahora slo los pagos asignados al otro
jugador en los que destacamos el pago mnimo que puede obtener para cada una de sus
estrategias. Subrayamos el mximo de los mnimos y su estrategia maximin.
mnimos
Mi estrategia
En efecto,
Mi
estrategia
La estrategia del
otro jugador
La estrategia del
otro jugador
Mi estrategia
En esta nueva tabla mi estrategia maximin sigue siendo la B y la estrategia maximin del
otro jugador sigue siendo la C. Pero la solucin ahora ya no es estable. Si jugamos repetidas
veces y yo repito mi estrategia maximn, B, el otro estar tentado de cambiar su estrategia,
pasando de la C a la B con lo que obtendr un pago mayor, 6 en vez de 5.
Preso Y
lealtad traicin
lealtad 2 \ 2
10 \ 1
Preso X
traicin 1 \ 10
5\5
Los pagos a la izquierda o a la derecha de la barra indican los aos de crcel a los que es
condenado el preso X o Y respectivamente segn las estrategias que hayan elegido cada
uno de ellos.
En vez de expresar los pagos en aos de crcel, podramos indicar simplemente el orden de
preferencia de cada preso de los correspondientes resultados, con lo que el modelo pasa a
tener aplicacin ms general.
Preso Y
lealtad traicin
lealtad 2 \ 2
4\1
Preso X
traicin 1 \ 4
3 \ 3*
La aplicacin de la estrategia maximn conduce en este juego a un resultado subptimo. Al
no conocer la decisin del otro preso, la estrategia ms segura es traicionar. Si ambos
traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este
resultado es un punto de equilibrio de Nash y est sealado en la matriz mediante un
asterisco.
El dilema del prisionero, tal como lo hemos descrito, es un juego de suma no nula,
bipersonal, biestratgico y simtrico. Fue formalizado y analizado por primera vez
por A. W. Tucker en 1950. Es posiblemente el juego ms conocido y estudiado en
la teora de juegos. En base a l se han elaborado multitud de variaciones,
muchas de ellas basadas en la repeticin del juego y en el diseo de estrategias
reactivas
El modelo halcn-paloma
Jugador Y
Paloma
Halcn
Paloma
2,2
3,1
Halcn
1,3
Jugador X
*
4,4
Obsrvense las sutiles pero importantes diferencias de este modelo con el Dilema del
Prisionero. En principio la matriz es muy parecida, simplemente se han trocado las
posiciones de los pagos 3 y 4, pero la solucin y el anlisis son ahora muy diferentes.
Hay aqu dos resultados que son equilibrios de Nash: cuando las estrategias elegidas por
cada jugador son diferentes; en la matriz aqu representada esas soluciones estn marcadas
con un asterisco. Comprubese, por el contrario, que en el Dilema del Prisionero el
equilibrio de Nash est en el punto en que ambos jugadores traicionan.
Otra notable diferencia de este juego con otros es la importancia que aqu adquiere el orden
en que los jugadores eligen sus estrategias. Como tantas veces en la vida real, el primero
que juega, gana. El primero elegir y manifestar la estrategia Halcn con lo que el
segundo en elegir se ver obligado a elegir la estrategia Paloma, la menos mala.
Ftbol
Discoteca
Ftbol
1\2
4\4
Discoteca
3 \ 3*
2\1
Este juego, tal como lo hemos descrito, es un juego sin repeticin y sin transferencia de
utilidad. Sin repeticin significa que slo se juega una vez por lo que no es posible tomar
decisiones en funcin de la eleccin que haya hecho el otro jugador en juegos anteriores.
Sin transferencia de utilidad significa que no hay comunicacin previa por lo que no es
posible ponerse de acuerdo, negociar ni acordar pagos secundarios ("Si vienes al ftbol te
pago la entrada").
ABCDE
ABCD
ABC
ABE
ABCE
ABD
ACE
ABDE
ACD
BCE
ACDE
BCD
ADE
BDE
CDE
Por tanto:
BCDE
AB
BC
AC
BD
AD
BE
AE
CD
CE
DE
D
E
A no es redundante en 10 coaliciones
vencedoras
En cualquier coalicin formada por menos de cinco partidos, ninguno de los coaligados
debera aceptar un presupuesto inferior al indicado. Sea cual sea la coalicin vencedora que
se forme, el presupuesto puede ser repartido conforme al criterio del valor de Shapley.
Obsrvese que la propuesta de arbitraje de Shapley no conduce a una solucin nica ni
absolutamente estable. Sigue habiendo varias soluciones posibles. Pero en cualquier
coalicin que se forme, si el reparto se hace conforme al criterio de Shapley, no habr una
coalicin alternativa ms estable que ofrezca a los jugadores un pago superior.
Nmero de representantes
en el Parlamento Europeo
a partir de enero de 2004
Austria 17
Alemania 99
Blgica 22
Dinamarca 13
Espaa 50
Finlandia 13
Francia 72
Grecia 22
Holanda 25
Irlanda 12
Italia 72
Luxemburgo 6
Portugal 22
Reino Unido 72
Suecia 18
Juego 4.
Ejercicio. En el Tratado de la Unin Europea aprobado en Niza en diciembre de 2000
se acord que a partir del 1 de enero de 2004, el nmero de representantes de cada
pas miembro en el Parlamento Europeo ser el fijado en el cuadro adjunto. Intente
estimar la asignacin de un presupuesto de un billn de euros entre todos los pases
miembros para que sea aprobado por unanimidad por el Parlamento, de forma que
cada pas miembro reciba el valor de Shapley.
Aplicacin
El duopolio en la Teora de Juegos
En el oligopolio, los resultados que obtiene cada empresa dependen no
slo de su decisin sino de las decisiones de las competidoras. El
problema para el empresario, por tanto, implica una eleccin estratgica
que puede ser analizada con las tcnicas de la Teora de Juegos.
Supongamos que dos empresas, Hipermercados Xauen y Almacenes
Yuste, constituyen un duopolio local en el sector de los grandes
almacenes. Cuando llega la poca de las tradicionales rebajas de enero,
ambas empresas acostumbran a realizar inversiones en publicidad tan
altas que suelen implicar la prdida de todo el beneficio. Este ao se han
puesto de acuerdo y han decidido no hacer publicidad por lo que cada
una, si cumple el acuerdo, puede obtener unos beneficios en la
temporada de 50 millones. Sin embargo una de ellas puede preparar en
secreto su campaa publicitaria y lanzarla en el ltimo momento con lo
que conseguira atraer a todos los consumidores. Sus beneficios en ese
caso seran de 75 millones mientras que la empresa competidora
perdera 25 millones.
Los posibles resultados se pueden ordenar en una Matriz de Pagos
como la mostrada en el cuadro de la derecha. Cada almacn tiene que
elegir entre dos estrategias: respetar el acuerdo Cooperar o hacer
publicidad Traicionar. Los beneficios o prdidas mostrados a la
izquierda de cada casilla son los que obtiene Xauen cuando elige la
estrategia mostrada a la izquierda y Yuste la mostrada arriba. Los
resultados a la derecha en las casillas son los correspondientes para
Yuste.
MATRIZ DE PAGOS
Yuste
Cooperar
Traicionar
Cooperar
50,50
-25,75
Traicionar
75,-25
0,0
Xauen
COMPETENCIA EN PRECIOS:
MATRIZ DE PAGOS
Yuste
Cooperar Traicionar
Cooperar
50,50
0,75
Traicionar
75,0
-25,-25
Xauen
Si, como en el caso anterior, substituimos los valores concretos por su orden en la
escala de preferencias obtenemos una matriz que es conocida en Teora de Juegos
como Gallina o Halcn-Paloma.
2,2
4,1
mi barco
traicionar 1 , 4 3 , 3*
De nuevo aqu falla el mercado; "la mano invisible" de Adam Smith nos dirige
por mal camino; la mejor estrategia para cada familia, hagan lo que hagan los
dems, es no ser cuidadosa. El resultado de ello ser para todas ellas peor que
si todas fuesen cuidadosas. La expresin "la tragedia de los comunes" alude al
destino inexorable al que parece estar condenado cualquier recurso de
propiedad compartida.
El xito de la expresin "la tragedia de los comunes" es posible que sea debido
a que propone de forma muy clara y casi intuitiva las dos posibles soluciones
para ordenar el acceso de los ganados a los prados:
PROPIEDAD PRIVADA: el prado se divide en parcelas. A cada familia se
asigna el DERECHO al uso exclusivo de una parcela. Cada familia estar
entonces estimulada a cuidar de su parcela, a explotar los recursos de la forma
ms eficaz.
2. El componente negativo es una funcin del sobrepastoreo adicional generado por un animal
ms. Sin embargo, puesto que los efectos del sobrepastoreo son compartidos por todos los
pastores, la utilidad negativa de cualquier decisin particular tomada por un pastor es solamente
una fraccin de -1.
Al sumar todas las utilidades parciales, el pastor racional concluye que la nica decisin sensata
para l es aadir otro animal a su rebao, y otro ms... Pero esta es la conclusin a la que llegan
cada uno y todos los pastores sensatos que comparten recursos comunes. Y ah est la tragedia.
Cada hombre est encerrado en un sistema que lo impulsa a incrementar su ganado
ilimitadamente, en un mundo limitado. La ruina es el destino hacia el cual corren todos los
hombres, cada uno buscando su mejor provecho en un mundo que cree en la libertad de los
recursos comunes. La libertad de los recursos comunes resulta la ruina para todos."
Garret Hardin: "The Tragedy of Commons" en Science, v. 162 (1968),