Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCIÓN
La Teoría de Juegos es una teoría matemática que estudia las características generales de
las situaciones competitivas de manera formal y abstracta. Es útil para tomar decisiones en
casos donde dos o más personas que deciden se enfrentan en un conflicto de intereses. Así,
estudia la toma de decisiones en interacción (ejemplos: el juego de ajedrez, la negociación
política, las estrategias militares).
¿Dónde se utiliza?
3. Las estrategias:
4. Las salidas:
Determinadas por la mutua selección de estrategias.
Trasladado estas opciones y resultados a una matriz (en Teoría de juegos, también llamada
matriz de pagos) obtenemos el siguiente cuadro:
Por tanto la búsqueda de su mejor opción por parte de los distintos individuos que
componen un mismo grupo, da como resultado una pérdida de la optimización del resultado
a alcanzar no sólo como grupo, sino también a título individual. La optimización del
resultado como grupo pasa por no denunciar al otro, y pasarse un año cada uno en la cárcel.
La optimización del resultado individual pasa porque uno busque su mejor opción
(denunciar y salir libre) mientras el otro no (no denunciar). Los trabajos pioneros de Nash
muestran a este respecto cómo decisiones en que la cooperación se plantea como ventaja
competitiva en situaciones que consideran al propio colectivo como beneficiario, es decir,
cuando prima en la decisión la valoración como grupo y no el nivel individual, no siguen
los axiomas hasta entonces propugnados por Adam Smith y universalmente aceptados, esto
es, que la búsqueda y logro personales de la mejor opción individual nos llevarían a la
mejoría sustancial, a la optimización, del conjunto de la sociedad. Al contrario, la
optimización como grupo, como sociedad, proviene de buscar estrategias que descartan las
mejores opciones individuales, esto es, que la maximización del beneficio como grupo no
deriva de la maximización del beneficio individual, sino que incluso éste le perjudica y le
impide lograrlo como tal grupo. Otro aspecto que debemos considerar es que las personas
somos seres sustancialmente distintos. Nuestro pensamiento heurístico en gran medida nos
permite extraer inferencias que van más allá del puro análisis directo para pasar a un nivel
metarrepresentacional, esto es, de pensamiento estratégico. No se debe ignorar el hecho de
que en innumerables situaciones, ambos oponentes no se comunican entre sí. Obsérvese en
este punto la importancia que tienen las estrategias de «divide y vencerás» planteadas ante
las situaciones en que el grupo puede unirse para hacerse fuerte. Como hemos visto,
circunstancias y acontecimientos que tienen puntos en común con el dilema del prisionero
nos sirven para poder analizar el concepto de toma de decisiones racional y para ilustrar el
conflicto existente entre beneficio individual y bien colectivo. El dilema del prisionero
pone en cuestión el mito capitalista y neoliberal, el del juego individualista y el de «todos
contra todos», el de que es mejor que cada uno vaya a lo suyo, a maximizar su beneficio, el
de la ética materialista, el del egoísmo, el que se atienda de manera preferente a intereses
privados, ya que ello favorece al conjunto, que son motores que tirarán de todos,...porque
nos dice y demuestra que todo eso es falso que sea bueno para el conjunto de la sociedad.
La búsqueda del bien individual será bueno para alguno, pero malo para muchos, y desde
luego no maximizará las posibles ganancias del conjunto. Va también en contra de otro de
los mitos capitalistas cuando se afirmaba que quien se aparta con sus decisiones de su
estrategia óptima, aquélla que maximiza su resultado individual, sólo lo hace en su propio
perjuicio y para beneficio de la otra parte, como si de una situación de «gano-pierdes» se
tratase. Vemos que esto es, efectivamente, asimismo falso. En no pocas ocasiones éste es
precisamente el camino para maximizar el beneficio como grupo o comunidad, que a su vez
redunda en la obtención de un gran resultado individual para todos, convirtiéndose por
tanto en una situación de «gano-ganas». Por tanto, vemos cómo decisiones personales,
tomadas con el fin de maximizar el beneficio individual, y sin tener en cuenta los resultados
globales para todo el segmento, el mercado, la sociedad, etc., son malas en su conjunto, no
optimizando los resultados globales para el grupo, ni los particulares para dicho individuo.
Quienes toman sus decisiones de manera racional e individual, buscando proteger y
maximizar sus intereses, actúan como hemos visto para obtener no los mejores resultados
que se pueden obtener a nivel colectivo, sino los mejores que él pueda obtener; pero así
estamos alcanzando una solución individual. Cuando las decisiones se coordinan y se
establecen acuerdos de colaboración para establecer estrategias comunes, que busquen
maximizar los resultados globales, de todos nosotros, compartiéndose ganancias, el acuerdo
al que se llega se llama solución cooperativa. Por tanto, para el conjunto de la sociedad es
bueno que cada uno actúe pensando sencillamente en maximizar el resultado conjunto,
aunque ello, en principio, no vaya tan favorablemente en busca de la maximización de su
resultado individual. Aunque en no pocas ocasiones, y como nos enseña el dilema del
prisionero, y ya hemos apuntado anteriormente, ir a buscar nuestra mejor opción y nuestro
mejor resultado tiene como consecuencia tener que conformarnos con un resultado
mediocre, inferior al que hubiéramos obtenido si hubiéramos pensado en el bien de todos, y
haber rebajado nuestras expectativas y ambiciones individuales.
Comencemos con un ejemplo consistente en un juego bien sencillo (atribuido a John von
Neumann), una versión simplificada del póker. Supongamos dos jugadores, y solo dos
cartas:
Las reglas del juego son así: a) Se va al mazo (y Johann gana el pozo,
1$).
1. Cada jugador aporta 1$ al pozo.
b) “Ve” la apuesta y agrega 1$ al pozo.
2. Johann levanta una carta y la mira.
TIPOS DE JUEGOS
Cabe distinguir dos tipos básicos de juegos, o dicho de otro modo, dos enfoques básicos en
el análisis de un juego, cooperativo y no cooperativo. En el enfoque cooperativo se analizan
las posibilidades de que algunos o todos los jugadores lleguen a un acuerdo sobre qué
decisiones va a tomar cada uno, mientras que en el enfoque no cooperativo se analiza qué
decisiones tomaría cada jugador en ausencia de acuerdo previo. Entre los juegos no
cooperativos cabe hacer dos distinciones básicas, juegos estáticos o dinámicos, y juegos
con o sin información completa. En los juegos estáticos los jugadores toman sus decisiones
simultáneamente (o dicho de manera más precisa, cada jugador decide sin saber qué han
decidido los otros), mientras que en los dinámicos puede darse el caso de que un jugador
conozca ya las decisiones de otro antes de decidir. En los juegos con información completa,
todos los jugadores conocen las consecuencias, para sí mismos y para los demás, del
conjunto de decisiones tomadas, mientras que en los juegos con información incompleta,
algún jugador desconoce alguna de esas consecuencias.
JUEGOS ESTÁTICOSCON INFORMACIÓNCOMPLETA
Como en otras clases de juegos, los elementos fundamentales de un juego estático con
información completa son: jugadores, estrategias disponibles para cada jugador, y
ganancias o pagos resultantes para cada jugador (utilidad que a cada uno reporta cada
resultado del juego).
En este caso, los jugadores toman sus decisiones simultáneamente (o dicho con más
precisión, sin conocer las decisiones de los otros) y de una sola vez, y a continuación
reciben las ganancias, que dependen de la combinación de decisiones tomadas. Por esta
razón, los juegos estáticos reciben también el nombre de «juegos con jugadas simultaneas».
Además, se supone que es de dominio público el conocimiento de la estructura completa
del juego. Es decir, todos los jugadores conocen las estrategias o acciones disponibles para
cada jugador y las ganancias resultantes de cada combinación de acciones, y además todos
saben que todos las conocen, y todos saben que todos saben que todos las conocen... y así
sucesivamente. Estos juegos suelen representarse mediante la llamada forma estratégica, de
la que se dice que es la representación normal del juego. Para ello, se usa generalmente una
bimatriz (si hay dos jugadores), o una representación análoga si hay más de dos jugadores.
Se analizan en esta sección las distintas clases de jugadas de azar, y sus consecuencias en el
análisis de los juegos, ya que los aspectos de información privada de los juegos estáticos de
información incompleta se van a modernizar haciendo intervenir al azar a modo de jugador
ficticio, de manera que sus jugadas sean observadas por unos jugadores, pero no por otros.
Se presentan asimismo algunos ejemplos introductorios y de motivación, y una breve
introducción a la decisión bayesiana.
Para introducir la forma extensiva de representación de un juego nos servimos del siguiente
juego sencillo.
Ejemplo
Pedro subasta un billete de 50 euros entre Carlos y Blanca con las siguientes reglas: se
juega por turnos. Aquél a quien le toca jugar puede pasar, o pujar con 20 euros más que el
anterior (suponiendo que los tiene). Empieza Blanca (pasando o pujando con 20euros). Si
un jugador decide pasar, ya no puede pujar en una jugada posterior. Gana el último en
pujar, que se lleva el billete. Si ninguno ha pujado se llevan 25 euros cada uno. Ambos
jugadores deben pagar su última puja. Aparte de las reglas es de conocimiento común que
cada jugador tiene sólo 60 euros.
El árbol anterior tiene un punto inicial o raíz, desde el que se empieza el juego, en este caso
la elección de Blanca (jugadora 1) entre pasar (P) o pujar con 20 euros (20).Ello da lugar a
dos ramas, una para cada posible elección de Blanca. La primera rama, a la que se accede si
Blanca elige P, a la vez se divide en dos ramas, desde el nodo que corresponde a la elección
de Carlos entre pasar (P) o pujar con 20 euros (20). Si Carlos decide pasar (P), se termina el
juego y cada jugador recibe25 euros, mientras que si decide pujar con 20 euros, el juego
termina, llevándose Carlos los 50 euros y teniendo que pagar su puja, por lo que obtiene un
beneficio de 30 euros, sin que Blanca tenga que pagar ni recibir nada (situación que se
recoge en el nodo que lleva asociados los valores 0, 30). La segunda rama, a la que se
accede si Blanca puja con 20 euros, a su vez se divide en dos ramas, desde el nodo que
corresponde a la elección de Carlos entre pasar (P) o pujar con 40 euros (40), 20 euros más
que la puja de Blanca. Si el jugador 2 elige P, se acaba el juego, recibiendo Blanca los 50
euros, pero teniendo que pagar los 20 de su puja, sin que Carlos reciba ni pague nada. Si
Carlos puja con 40 euros llega el turno de nuevo a Blanca que debe elegir entre pasar (y se
acaba el juego, con pagos. -20, 10 respectivamente, ya que Blanca debe pagar los 20 euros
de su última puja y Carlos los40 euros de su última puja, recibiendo éste los 50 euros) o
pujar con 60, recibiendo Blanca los 50 euros y debiendo pagar 60 euros y Carlos 40,
correspondientes a su última puja, con lo que también se acaba el juego pues ningún
jugador tiene más de 60euros para seguir pujando.
o Los jugadores, que en este caso son la jugadora 1 (Blanca) y el jugador 2 (Carlos).
o Un conjunto de nodos, los cuales corresponden a situaciones de elección de alguno
de los jugadores o de final del juego.
o Un conjunto de acciones, que son las que enlazan un nodo con otro, y que
corresponden a elecciones de los jugadores.
o Unos vectores de pagos, cada uno de los cuales está asociado a un nodo de final de
juego y que tiene dos componentes, la primera de las cuales recoge el pago (o la
utilidad) que recibe o que obtiene el jugador 1, y la segunda de las cuales recoge el
pago (o la utilidad) que recibe o que obtiene el jugador 2 si el juego termina en ese
nodo.
JUEGOS REPETIDOS
Algunos juegos dinámicos tienen una estructura natural por etapas, y tienen además la
siguiente propiedad en cuanto a la información de los jugadores: en el momento de
comenzar una etapa cualquiera, es de dominio público cuál ha sido la historia previa del
juego, es decir, cómo se ha desarrollado el juego (qué jugadas ha realizado cada jugador, y
qué resulta-dos se han producido en las jugadas de azar, si estas existen) hasta ese
momento. Un caso particular dentro de este tipo de juegos es el de los juegos repetidos, en
los cuales en cada etapa actúan los mismos jugadores y juegan siempre el mismo juego. En
este tipo de juegos, llamados habitualmente polietápicos, es útil razonar hacia atrás del
siguiente modo: ¿cómo se jugarán los subjuegos que representan a la última etapa? Si lo
supiéramos, podríamos «podar» la última etapa del juego y considerar como terminales los
nodos que preceden inmediatamente a dicha etapa. A continuación repetiríamos la pregunta
anterior, pero referida a los subjuegos que ahora representan la última etapa. En la medida
en que podamos responder a la pregunta anterior podremos dar un paso hacia atrás en el
árbol y reducir éste un poco más. Así seguiríamos hasta llegar al nodo inicial. En el caso
más simple de los juegos dinámicos con información perfecta, se avanzaba hacia atrás
suponiendo que cada jugador realizaba una acción óptima, acción que podíamos identificar
siempre ya que los pagos o consecuencias de sus acciones dependían sólo de dicho jugador.
Sin embargo, en el caso que nos ocupa, y cuando se está jugando una determinada etapa,
puede no tener sentido preguntarse por la acción (o estrategia) óptima de un jugador, pues
sabemos que dicha acción óptima no tiene por qué existir de modo absoluto, sino que
depende de qué hagan los otros jugadores. Ahora bien, como estamos especialmente
interesados en buscar los ENPS del juego, es razonable suponer que, en la que actualmente
sea la última etapa, los jugadores jugarán algún EN. Supuesto que en los subjuegos que
representan la última etapa los jugadores juegan un EN particular, ya podemos podar el
árbol y avanzar en el razonamiento hacia atrás. Esto significa que también en estos juegos
es aplicable la inducción hacia atrás generalizada. Entonces, ¿por qué diferenciarlos del
resto de los juegos y darles un tratamiento individualizado? La respuesta es que este tipo de
juegos se caracteriza por la existencia de una interacción repetida de los mismos jugadores
en las mismas circunstancias. Esta característica de los juegos repetidos nos permite
utilizarlos para intentar explicar porqué muchos fenómenos económicos y sociales
producen comportamientos muy diferentes en función del número de interacciones, es
decir, nos permiten entender por qué los individuos se comportan de una determinada
forma cuando saben que la situación a la que se enfrentan no se va a volver a repetir, y de
un modo completamente diferente cuando saben que en un periodo corto de tiempo o con
determinada periodicidad se va a repetir la misma situación. Intuitivamente, la razón de esta
diversidad de comportamientos se encuentra en la creencia de los jugadores en que el
comportamiento presente puede de alguna manera afectar al comportamiento futuro de los
individuos, de tal manera que se puede condicionar con el fin de sacar partido de él en el
futuro. Dicho de otro modo, si el comportamiento futuro se puede ver influido por el
comportamiento presente, entonces un individuo se verá en cierta medida estimulado a
evitar aquellas acciones que puedan generar un castigo futuro y a realizar aquellas que
puedan verse recompensadas más adelante. En lo que sigue analizaremos bajo qué
circunstancias un jugador debe condicionar su comportamiento con el fin de evitar un
castigo o buscar una recompensa en el futuro. Es decir, analizaremos la credibilidad de las
amenazas o promesas que los jugadores puedan hacerse en situaciones que están sujetas a
una interacción repetida. Merece la pena subrayar la característica crucial que diferencia un
juego repetido finitamente de un juego repetido infinitamente: se trata del conocimiento de
los jugado-res al principio del juego sobre cuál es la última etapa. En un juego repetido n
veces, los jugadores saben desde el principio (o dicho con más precisión, es de dominio
público)que va a haber exactamente n etapas del juego, tras las cuales se acaba, y que la
etapa enésima será la última. Por el contrario, en un juego repetido infinitas veces no se re-
quiere la repetición efectiva (por lo demás imposible) del juego de etapa, sino la posibilidad
permanente de proseguir el juego, de manera que de ninguna etapa puede decirse
anticipadamente que va a ser la última.
JUEGOS COOPERATIVOS
Los Juegos Cooperativos se caracterizan por el hecho de que los jugadores pueden cooperar
entre ellos para buscar un beneficio común. Una cuestión importante en la Teoría de Juegos
Cooperativos es que en el momento en que varios jugadores deciden cooperar en algún
sentido, debe formarse una coalición entre estos jugadores. Los jugadores de esta coalición,
en el momento en que se forma, actuarán buscando el máximo beneficio posible para la
coalición. Una coalición puede estar formada por cualquier grupo de jugadores de cualquier
tamaño. El pago de esta coalición, esto es, los beneficios que la coalición obtendrá del
juego, será función de la coalición, y deberá ser repartido al finalizar el juego entre los
jugadores que forman la coalición. Este pago será representado por un número.