Apuntes de Teoría de La Decisión y de Los Juegos - Juegos Estáticos

Apuntes de Teoría de la Decisión y de los Juegos:
Juegos Estáticos
Universidad Carlos III de Madrid
Curso 2001-02
1 La Teoría de los Juegos

La Teoría de los Juegos proporciona una metodología para el estudio de los problemas
de decisión multipersonal; es decir, para el estudio de las situaciones de decisión
interactiva en las acciones de cada individuo (dentro de un grupo) tienen consecuen-
cias sobre el bienestar de todos los individuos del grupo. En estas situaciones, a las
que en adelante nos referimos como juegos, los individuos se enfrentan a dos tipos de
incertidumbre: una incertidumbre exógena, asociada con elementos aleatorios fuera
de su control, y otra incertidumbre endógena, consecuencia del desconocimiento que
cada individuo tiene sobre los efectos de las acciones que vayan a adoptar los demás
individuos.
1.1 Juegos cooperativos y no cooperativos

El tratamiento de un juego requiere distinguir entre aquellas en las que los individuos
tienen la posibilidad de alcanzar acuerdos “contractuales” por los que se comprometen
1
a realizar determinadas acciones, de aquellas en las que los acuerdos contractuales
no son posibles. Las primeras son objeto de estudio de la Teoría de los Juegos
cooperativos, cuyo tema central es el estudio de propuestas alternativas de reparto
de las ganancias que se derivan de la cooperación.
La Teoría de los Juegos no cooperativos estudia situaciones en las que los indivi-
duos no pueden contratar sus acciones, yo sea porque no exista una autoridad externa
que garantice el cumplimiento de los contratos (como ocurre, por ejemplo, con las
relaciones comerciales, políticas, etc., entre estados soberanos), o porque las acciones
involucren derechos inalienables (que impiden, por ejemplo, que un trabajador renun-
cie a su derecho a rescindir su relación laboral con una empresa), o porque involucren
acciones consideradas ilegales (como, por ejemplo, los acuerdos para la fijación de pre-
cios entre empresas o los acuerdos de reparto de territorio entre mafiosos), o porque
no sean observables (que imposibilita la compra-venta de votos o resta credibilidad a
declaraciones de “invulnerabilidad a la corrupción” — ja ja).
Los juegos no cooperativos se caracterizan por la presencia de una mezcla de
intereses conflictivos y de posibilidades de cooperación que dificultan su tratamiento.
Estas notas se dedican a una breve presentación de la teoría básica de los juegos no
cooperativos.
1.2 Juegos estáticos y dinámicos: forma normal y extensiva

Como en los problemas de decisión individual, en el tratamiento de los juegos no
cooperativos conviene distinguir entre juegos estáticos y juegos dinámicos.
Los juegos estáticos son aquellos en los que los jugadores adoptan acciones de
forma simultánea o cuando, aunque no se realicen de forma simultánea, no son direc-
tamente observables. En estos juegos, los jugadores deciden sus acciones sobre la base
de la información disponible inicialmente y durante el proceso de toma de decisiones
no se genera información adicional. Ejemplos de este tipo de juegos son las elecciones
por voto secreto,
Los juegos dinámicos se caracterizan por que en el proceso de toma de decisiones
los jugadores reciben nueva información, que puede ser información acerca de acciones
adoptadas por otros jugadores (o por uno mismo) o resultados de movimientos de azar.
Ejemplos
Como los problemas de decisión individual, los juegos pueden representarse en
forma normal (una representación análoga a la matriz de pagos en problemas de de-
2
cisión individual) o en forma extensiva (análoga a los árboles de decisión). Cualquier
juego puede representarse en un formato u otro. Sin embargo, mientras que la forma
normal es una representación económica y precisa de un juego estático, no lo es de
un juego dinámico, sino que, como veremos, la representación en forma normal pro-
porciona una información deficiente de un juego dinámico.
2 Juegos Estáticos: forma normal

Los elementos que describen un juego en forma normal G son
• Un conjunto de jugadores N = {1, . . . , n}.
• Un conjunto de acciones o estrategias posibles Si para cada jugador i ∈ N.
• Una función de utilidad (esperada) sobre los perfiles de acciones posibles (s1 , . . . , sn ) ∈
S = S1 × · · · × Sn , ui : S → R, para cada jugador i ∈ N.
Así, un juego en forma normal esta descrito por una terna (N, S, u).
2.1 Ejemplos
Ejemplo 1 (Pares/Nones). En este juegos dos individuos eligen simultáneamente
un número par o impar (non) (“sacan dedos”); si la suma es par (non), el Jugador 2
(1) paga un euro al Jugador 1 (2). Este juego puede representarse en forma normal
como G = (N, S, u), donde N = {1, 2}, y para i ∈ N, Si = {Pi , Ni } (P por “par”
e N por “non”) y 1 = u1 (P1 , P2 ) = u1 (N1 , N2 ) = −u2 (P1 , P2 ) = −u2 (N1 , N2 ) =
−u1 (P1 , N2 ) = −u1 (N1 , P2 ) = u2 (P1 , N2 ) = u2 (N1 , P2 ). Esta información puede de-
scribirse de forma compacta mediante la siguiente tabla:
P2 N2
P1 1, −1 −1, 1
N1 −1, 1 1, −1
En la tabla la fila representan la estrategia elegida por el del Jugador 1 y la columna
la elegida por el Jugador 2. Para cada perfil de estrategias (fila, columna), el primer
(segundo) número de cada casilla representa la utilidad esperada del Jugador 1 (2).
En los siguientes ejemplos mantenemos esta convención.
3
Ejemplo 2 (Dilema del Prisionero). Dos individuos son detenidos e incomunicados.
La policía sospecha que estos individuos han cometido un delito grave (penado con
4 años de cárcel), aunque sólo dispone de pruebas para condenarles por un delito
menor (penado con 1 año de cárcel). La policía propone a cada preso el mismo trato:
si delata a su compañero (D) quedará libre (y por supuesto éste será condenado a 4
años de cárcel). Si ambos se acusan mutuamente, la pena se reduciría de 4 a 3 años
(para cada uno), mientras que si ambas guardan silencio (es decir, si “cooperan”
entre ellos, C) entonces, con la evidencia circunstancial de que dispone la policía sólo
podrían ser condenados a un año de cárcel. Este juego puede representarse en forma
normal mediante la siguiente tabla:
C2 D2
C1 −1, −1 −4, 0 .
D1 0, −4 −3, −3
Ejemplo 3 (Batalla de los Sexos). Alberto y Bea quieren salir juntos, pero discrepan
sobre a donde ir. Alberto es un gran aficionado al ballet, mientras que Bea prefiere el
fútbol. Dadas sus preferencias, a la hora de decidir a dónde ir se enfrentan al juego
representado en la siguiente tabla:
F2 B2
F1 1, 2 0, 0 .
B1 0, 0 2, 1
Ejemplo 4 (Coordinación). Dos napolitanos aparcan sus coches en el mismo garaje

y con frecuencia coinciden al entrar o salir. En varias ocasiones han coincidido y
hasta ahora han tenido suerte. Sin embargo, son conscientes del riesgo, así que han
decidido discutir un acuerdo sobre si circular por la derecha (D) o por la izquierda
(I) al entrar y salir del garaje. El juego al que se enfrentan está representado en la
siguiente tabla:
D2 I2
D1 1, 1 0, 0
I1 0, 0 1, 1
Los ejemplos 1-4 representan situaciones en las que las posibilidades de coop-
eración y conflicto de intereses están mezcladas de manera inextricable. Estos dos
ingredientes, cooperación u conflicto, están presenten, en distinto grado, en cualquier
4
juego no cooperativo. El conflicto de intereses es extremo en el Ejemplo 1, muy
intenso en el Ejemplo 2, y también está presente, aunque en menor medida, en el
3; sin embargo, está ausente en el Ejemplo 4. Las posibilidades de cooperación son
crecientes en los ejemplos 2, 3 y 4, mientras que son inexistentes en el Ejemplo 1.
El Ejemplo 1 pertenece a una clase de juegos que se denominan de suma cero
o estrictamente competitivos. En estos juegos los intereses de los jugadores
son diametralmente opuestos: en cada circunstancia posible, las ganancias de cada
jugador son pérdidas del oponente. Obviamente, los juegos de suma cero representan
situaciones de puro conflicto. Estas situaciones son relativamente infrecuentes en
problemas económicos.
El Ejemplo 2 representa un juego recurrente en situaciones económicas: aunque
existen amplias posibilidades de cooperación, la existencia de ganancias substanciales
derivadas de la desviación del comportamiento cooperativo impiden que este se ma-
terialice. Como veremos, la competencia entre empresas o la provisión de bienes
públicos son ejemplos de este tipo de situaciones.
2.2 Racionalidad e Información

Las propuestas de solución que se presentan a continuación están justificadas bajo dos
hipótesis fundamentales sobre la conducta de los individuos y su información básica.
Estos hipótesis son:
Racionalidad. El objetivo de cada individuo es maximizar su bienestar.
Esta hipótesis no excluye la posibilidad de que el bienestar de un individuo de-
penda de la situación de otros individuos y, por tanto, admite la posibilidad de
comportamientos tanto individualistas como altruistas. Ahora bien, cualquier con-
sideración sobre el bienestar de los demás debe estar recogida expresamente en la
función de utilidad esperada de cada jugador.
Conocimiento. El hecho de que los individuos son racionales es de conocimiento
público; es decir, todos lo saben, todos saben que todos lo saben, todos saben que
todos saben que todos lo saben, ...(ad infinitum).
2.3 Soluciones a Juegos Estáticos

Predecir el comportamiento de los jugadores de un juego estático requiere identificar
un perfil de estrategias o acciones y, por tanto, identificar indirectamente el
resultado del juego. Proponemos dos conceptos de solución para los juegos estáticos
5
no cooperativos: el conjunto de estrategias racionalizables y el conjunto de equilibrios
de Nash.
2.4 Estrategias Racionalizables

En esta primera aproximación formulamos un concepto de solución que se basa no
tanto en identificar positivamente la conducta de los jugadores, como en eliminar de
nuestra consideración aquellas acciones que definitivamente no son compatibles con
las hipótesis de racionalidad y conocimiento común y que, por tanto, no cabe esperar
que se adopten. Para formalizar este concepto necesitamos primero introducir la
noción de estrategia estrictamente dominada.
Informalmente, una estrategia está estrictamente dominada si existe otra estrate-
gia posible que es uniformemente mejor, es decir, que proporciona al jugador un pago
mayor cualesquiera que sean las estrategias de los demás jugadores. Obviamente, un
jugador racional nunca utilizará una estrategia estrictamente dominada, puesto que
esta conducta sería inconsistente con nuestro postulado de que los jugadores adoptan
siempre aquellas acciones que maximizan su bienestar. Obsérvese que en esta de-
scripción hemos considerado cualquier perfil estrategias de los demás jugadores como
posible. Sin embargo, la noción de estrategia estrictamente dominada debería formu-
larse respecto a los al conjunto de perfiles de estrategias para los demás jugadores
que el jugador cree que podrían adoptarse. Por ello, formulamos la noción de estrate-
gia dominado respecto a un conjunto dado de perfiles de estrategias de los demás
jugadores.
Consideramos en juego en forma normal G = (N, S, u). Recordemos que S =
S1 × S2 × · · · × Sn es el conjunto de perfiles de estrategias posibles. Usaremos la
notación s = (s1 , s2 , . . . , sn ); asimismo, para i ∈ N escribiremos s = (si , s−i ), donde
s−i ∈ S−i = S1 × · · · Si−1 × Si+1 · · · × Sn es un perfil de estrategias que especifica una
acción para cada jugador excepto el i.
Estrategias estrictamente dominadas. Sea Ŝ = Ŝ1 × Ŝ2 × · · · × Ŝn , donde

Ŝi ⊆ Si . Decimos que la estrategia si ∈ Ŝi está estrictamente dominada respecto a Ŝ
si existe s0i ∈ Ŝi tal que para todo s−i ∈ Ŝ−i tenemos ui (s0i , s−i ) > ui (si , s−i ).
Como ya hemos discutido, el uso estrategias estrictamente dominadas (respecto

a S) es inconsistente con la hipótesis de racionalidad. Por tanto, estas estrategias
pueden ser eliminadas como estrategias posibles. Pero puesto que este hecho puede
ser inferido por cualquier jugador que sepa que los jugadores son racionales, tenemos
6
que llevar este argumente hasta sus últimas consecuencias, ya que es posible que
una vez eliminadas las estrategias estrictamente dominadas respecto a S, aparezcan,
sucesiva mente, nuevas estrategias estrictamente dominadas. Para proporcionar un
concepto de solución consistente con la hipótesis de que la racionalidad es un hecho de
conocimiento público, hemos de eliminar iterativamente todas las estrategias estric-
tamente dominadas. A continuación se formaliza este procedimiento de eliminación.
Estrategias racionalizables. Definimos la secuencia {S 0 , S 1 , . . . , S k , . . .} de perfiles

de estrategias que sobreviven a la eliminación iterativa de estrategias estrictamente
dominadas. Sea S 0 = S, y para k = 1, 2, . . . , definimos el conjunto S k = S1k ×S2k ×· · ·×
Snk , donde para cada i ∈ N, Sik es el conjunto de estrategias que no están estrictamente
dominadas respecto a S k−1 . Así, la secuencia {S k } se obtiene eliminando en cada
iteración las estrategias estrictamente dominadas respecto al conjunto de estrategias
no eliminadas en etapas anteriores. Por tanto, cada elemento de la sucesión está
contenido en el anterior: S 0 ⊇ S 1 ⊇ · · · ⊇ S k−1 ⊇ S k ⊇ . . . , de manera que se trata
de una sucesión decreciente. El conjunto de perfiles de estrategias racionalizables S ∞
es el límite de esta sucesión, que podemos calcular como
∞
\
∞
S = Sk.
k=0
Propiedades de S ∞ . Las dos propiedades básicas del conjunto S ∞ son
1. S ∞ 6= ∅, y
2. Si el conjunto de perfiles de estrategias es finito entonces puede calcularse en

un número finito de iteraciones; es decir, existe k̄ tal que S ∞ = S k̄ .
La primera propiedad es consecuencia del siguiente hecho: para que haya una
estrategia estrictamente dominada debe haber otra que la domine. Por tanto, todos
los conjuntos de la secuencia {S 0 , S 1 , . . . , S k , . . .} son no vacíos.
La segunda propiedad es consecuencia del hecho de que si en alguna iteración
tenemos S k = S k+1 entonces la secuencia se hace constante, con lo que tenemos
S ∞ = S k . Por tanto, el número máximo de iteraciones necesarios para calcula S ∞ es
igual al numero de perfiles de estrategias contenidos en S menos n (porque al menos
una estrategia para cada jugador sobrevive a la eliminación iterativa).
Cálculo de S ∞ . Para calcular el conjunto de estrategias racionalizables de un juego

G = (N, S, u) conviene seguir el siguiente procedimiento:
7
1. Eliminar las estrategias estrictamente dominadas de cada jugador identificando
el conjunto S1 .
2. Considerar ahora el juego reducido que resulta de eliminar los perfiles de estrate-
gias que no están en S1 y sus correspondientes pagos. Identificar las estrategias
estrictamente dominadas en este nuevo juego.
3. Continuar este proceso hasta que en alguna iteración k̄ no se encuentren es-

trategias estrictamente dominadas. El conjunto S ∞ coincide con S k̄ .
A continuación aplicamos este procedimiento para encontrar el conjunto de es-

trategias racionalizables en varios ejemplos.
Ejemplos: En los ejemplos 1-4 el conjunto S ∞ se puede calcular fácilmente: en

los ejemplos 1, 3 y 4 tenemos S ∞ = S, pues ninguna estrategia está estrictamente
dominada respecto a S. En el Ejemplo 2, las estrategia C1 y C2 están estrictamente
dominadas en S y por tanto S ∞ = {(D1 , D2 )}.
A continuación presentamos un ejemplo en el que el cálculo del conjunto S ∞
requiere varias etapas de eliminación de estrategias estrictamente dominadas.
Ejemplo 5. Consideremos el siguiente juego en forma normal:
A2 B2 C2
A1 1, 1 0, 0 −1, 0
B1 0, 0 0, 6 10, −1
C1 2, 0 10, −1 −1, −1
1. Cálculo de S 1 : C2 está estrictamente dominada (por A2 ); no hay ninguna otra

estrategia estrictamente dominada para ningún jugador. Por tanto S11 = S,
S21 = {A2 , B2 }.
2. El juego (N, S 1 , u) es
A2 B2
A1 1, 1 0, 0
.
B1 0, 0 0, 6
C1 2, 0 10, −1
Las estrategias A1 y B1 están estrictamente dominadas (por C1 ). No hay ninguna
estrategia estrictamente dominada para el Jugador 2. Por tanto, S12 = {C1 }, y
S22 = S21 = {A2 , B2 }.
8
A2 B2
.
C1 2, 0 10, −1
En este juego la estrategia B2 está estrictamente dominada (por A2 ). Por tanto,
S13 = {C1 }, y S23 = {A2 }.
A2
.
C1 2, 0
En este juego no hay estrategias estrictamente dominadas. Por tanto, S 4 = S 3 .
Consiguientemente, para k ≥ 3, S k = S 3 = S ∞ = {(C1 , A2 )}.
2.5 Equilibrio de Nash

El conjunto S ∞ es un conjunto generalmente grande. De hecho, con frecuencia (como
muestran los ejemplos 1, 3 y 4) no hay estrategias estrictamente dominadas, de man-
era que S ∞ = S. En este caso, este concepto de solución carece de poder predictivo
alguno. Necesitamos, por tanto, un concepto de solución más operativo, que identi-
fique positivamente las estrategias que cabría esperar que adopten los jugadores.
El concepto de equilibrio de Nash1 identifica los perfiles de estrategias que
son estables, en el sentido de que ningún jugador quiera desviarse si espera que los
demás adopten las acciones que se prescribe para ellos. El equilibrio de Nash indica
el desenlace predecible del juego, y puede interpretarse como un “acuerdo” o una
“norma” que tiene la propiedad de que es autosostenible: una vez aceptado, ningún
jugador tiene incentivos para modificarlo unilateralmente. Otra interpretación intere-
sante contempla al concepto de equilibrio de Nash como perfil de expectativas que
se “autoconfirman”, en el sentido de que si los jugadores esperan que los demás se
comporten de acuerdo con lo prescrito, entonces estas acciones ocurren como con-
secuencia de la conducta óptima de los jugadores; es decir, las expectativas de los
jugadores son “racionales” porque son consistentes con la conducta racional.
Consideremos un juego en forma normal G = (N, S, u).
1
John Nash (1928—), se licenció en matemáticas a los 20 años en el Carnegie Institute of Tech-
nology y se doctoró a los 22 años (con una tesis de 27 páginas) en Princeton. Profesor del MIT
de Boston, enfermó muy joven y tuvo que abandonar la investigación. Recibió el premio Nobel de
economía en 1994.
9
Equilibrio de Nash. Un equilibrio de Nash (EN) de G es un perfil s∗ = (s∗1 , . . . , s∗n )
tal que para cada Jugador i y cada estrategia si ∈ Si tenemos
¡ ¢
ui (s∗ ) ≥ ui si , s∗−i .
Escribimos EN(G) para denotar el conjunto de equilibrios de Nash del juego G.

Como veremos, el conjunto G puede contener más de un elemento (como ocurre en
los ejemplos 3 y 4 que discutimos más abajo). También puede ser vacío (como en el
Ejemplo 1); trataremos este problema más adelante.
Un equilibrio de Nash se caracteriza por que cada jugador responde óptimamente
a las estrategias de los demás jugadores. Esta interpretación permite reformular el
concepto de equilibrio de Nash como una solución a un sistema de ecuaciones. Para
cada jugador i ∈ N y para cada perfil de estrategias s−i ∈ S−i para los demás ju-
gadores, identifiquemos la estrategia que maximiza la utilidad del Jugador i, Ri (s−i ).
Con frecuencia nos referimos a Ri (s−i ) como la mejor respuesta del Jugador i al perfil
s−i – para simplificar, supondremos, por el momento, que la óptima es única, aunque
generalmente no lo será. Con esta notación, podemos caracterizar a los equilibrios de
Nash como las soluciones al sistema de ecuaciones2
s1 = R1 (s−1 )
s2 = R2 (s−2 )
..
.
sn = Rn (s−n ).
Para mostrar la utilidad de esta formulación para el cálculo de los equilibrios de

Nash de un juego, discutimos los ejemplos 1-5.
Ejemplos:
1. Consideremos el juego del Ejemplo 1. En la tabla adjunta hemos subrayado la

mejor respuesta de cada jugador: por ejemplo, el pago del Jugador 1 subrayado
el la posición (1,1) de la matriz indica que la mejor respuesta del Jugador 1
a la estrategia s2 = P2 es P1 ; análogamente el pago del Jugador 2 subrayado
en la posición (1,2) indica que la mejor respuesta del Jugador 2 a la estrategia
2
Puesto que cada jugador puede tener más de una mejor respuesta (es decir, Ri (s−i ) puede ser
un conjunto en vez de un único punto), el sistema de ecuaciones debería formularse sustituyendo el
símbolo de igualdad (=) por el de pertenencia (∈).
10
s1 = P1 es N2 .
P2 N2
P1 1, −1 −1,1
N1 −1,1 1, −1
Así, en un equilibrio de Nash los pagos de ambos jugadores deben estar sub-
rayados. Como se observa, esta situación no existe en este juego. Volveremos
sobre este ejemplo.
2. Consideremos el Ejemplo 2. En la tabla hemos subrayado las mejores respuestas

de los jugadores 1 y 2.
C2 D2
C1 −1, −1 −4,0
D1 0, −4 −3,−3
El único perfil de estrategias que tiene ambos pagos están subrayados es el
(D1 , D2 ). Este perfil es el único equilibrio de Nash del juego. Por tanto EN(G) =
{(D1 , D2 )}.

F2 B2
F1 1,2 0, 0
B1 0, 0 2,1
Existen dos perfiles de estrategias que tienen ambos pagos subrayados, (F1 , F2 ) y
(B1 , B2 ). Ambos perfiles son equilibrios de Nash del juego. Por tanto EN (G) =
{(F1 , F2 ), (B1 , B2 )}.

I2 D2
I1 1,1 0, 0
D1 0, 0 1,1
También en este juego existen dos perfiles de estrategias que tienen ambos pagos
subrayados, (I1 , I2 ) y (D1 , D2 ). Por tanto, EN(G) = {(I1 , I2 ), (D1 , D2 )}.
5. Consideremos ahora el Ejemplo 5. En la tabla hemos subrayado las mejores

respuestas de los jugadores 1 y 2.
11
A2 B2 C2
A1 1,1 0, 0 −1, 0
B1 0, 0 0,6 10, −1
C1 2,0 10, −1 −1, −1
En este juego existen un único perfil de estrategias que tiene ambos pagos subrayados,
(C1 , A2 ). Por tanto, EN (G) = {(C1 , A2 )}.
Equilibrios de Nash y estrategias racionalizables. Como ilustran los ejemplos,

todo perfil de estrategias de equilibrio de Nash es un perfil de estrategias racionaliza-
ble; es decir, EN(G) ⊆ S ∞. Así, el concepto de equilibrio de Nash puede interpretarse
como una “propuesta de selección” dentro del conjunto S ∞ . El problema es que, como
revela el juego de Pares/Nones (Ejemplo 1), existen juegos que no poseen un equi-
librio de Nash. Para discutir este problema necesitamos introducir la posibilidad de
que los jugadores elijan sus estrategias de acuerdo con un procedimiento aleatorio.
2.6 Estrategias Mixtas

El juego de Pares/Nones (Ejemplo 1) carece de un equilibrio de Nash. Por otra
parte, nuestra perspectiva sobre el comportamiento de los jugadores en este juego,
en concreto nuestro objetivo de predecir qué estrategia adoptará cada jugador, no
parece la adecuada. Cualquiera que haya participado en este juego sugeriría que lo
que cabe esperar es que los jugadores jueguen Pares o Nones con aproximadamente
la misma frecuencia, de manera que lo que se observa es que cada perfil de estrategias
se adopte con una frecuencia igual a 1/4. Si un jugador fuese propenso a jugar Pares
(o Nones) más frecuentemente que Nones (Pares) y este hecho fuera reconocido por
su oponente, perdería con más frecuencia que ganaría. Para evitar la explotación
de esta información por parte del rival, cada jugadores debe protegerse eligiendo
aleatoriamente su estrategia.
Esta discusión sugiere que debemos considerar la posibilidad de que los jugadores
utilicen distribuciones de probabilidad para seleccionar sus acciones. Incluir esta posi-
bilidad supone cambiar nuestra perspectiva sobre el comportamiento de los jugadores.
Además, también tenemos que adoptar otra perspectiva sobre el objetivo de predecir
este comportamiento: el objetivo de identificar las estrategias que vayan a adoptar los
jugadores no es viable ni adecuado. Puesto que los jugadores eligen sus estrategias de
12
manera aleatoria, nuestro objetivo debe ser predecir la distribución de probabilidad
sobre los perfiles de estrategia posibles que mejor explica este comportamiento.
Consideremos un juego G = (N, S, u). Una estrategia mixta para el Jugador
i ∈ N es un distribución de probabilidad sobre Si . A partir de ahora, nos referiremos
a los elementos de Si como estrategias puras. Si el Jugador i tiene un número finito
de estrategias puras, es decir, Si = {s1i , . . . , sm
i }, entonces una estrategia mixta es
i
un vector σ i = (σ 1i , . . . , σ m k
i ), donde σ i ≥ 0 es la probabilidad con que el jugador
i
adopta la estrategia ski ; y puesto que σ i es una distribución de probabilidad, tenemos

Pmi k 1
k=1 σ i = 1. Obsérvese que la estrategia pura si es equivalente a la estrategia mixta
(1, 0, . . . , 0), la s2i a (0, 1, . . . , 0), etcétera, de manera que las estrategias puras son ca-
sos particulares de estrategia mixta (son distribuciones de probabilidad degeneradas).
El conjunto de estrategias mixtas del Jugador i lo denotamos como Σi , y el conjunto
de perfiles de estrategias mixtas como Σ = Σ1 × · · · × Σn .
Cada perfil de estrategias mixtas σ ∈ Σ es una lotería sobre el conjunto de perfiles
de estrategias puras S. Para cada σ ∈ Σ, la utilidad esperada de cada jugador i ∈ N
viene dada por
m1 X
X m2 mn
X
Eui (σ) = ··· σ k11 σ k22 · · · σ knn ui (sk11 sk22 · · · sknn ).
k1 =1 k2 =1 kn =1
Ejemplos:
1. En el juego del Ejemplo 1 supongamos que los jugadores eligen las estrategias
σ 1 = (p, 1 − p) y σ 2 = (q, 1 − q), donde p (q) es la probabilidad con que el
Jugador 1 (2) elige P1 (P2 ). En este caso σ = (σ 1 , σ 2 ) es una lotería que resulta
en (P1 , P2 ) con probabilidad pq, (P1 , N2 ) con probabilidad p(1 − q), etcétera.
La utilidad esperada del Jugador 1 es, por tanto,
Eu1 (σ) = pq(1) + p(1 − q)(−1) + (1 − p)q(−1) + (1 − p)(1 − q)(1)

= 1 − 2q + 2p(2q − 1).
Y puesto que se trata de un juego de suma cero, tenemos
Eu2 (σ) = −Eu1 (σ) = −1 + 2p + 2q(1 − 2p).
2. En el juego del Ejemplo 3 supongamos que los jugadores eligen las estrategias
σ 1 = (p, 1 − p) y σ 2 = (q, 1 − q), donde p (q) es la probabilidad con que el
Jugador 1 (2) elige F1 (F2 ). En este caso σ = (σ 1 , σ 2 ) es una lotería que resulta
13
en (P1 , P2 ) con probabilidad pq, (P1 , N2 ) con probabilidad p(1 − q), etcétera.
La utilidad esperada del Jugador 1 es
Eu1 (σ) = pq(1) + (1 − p)(1 − q)(2) = 2 − 2q + p(3q − 2).
Y la utilidad esperada del Jugador 2 es
Eu2 (σ) = pq(2) + (1 − p)(1 − q)(1) = 1 − p + q(3p − 1).
Equilibrio de Nash en estrategias mixtas: La noción de equilibrio de Nash se

puede formular fácilmente cuando los jugadores eligen una estrategia mixta, en vez
de una pura. Un perfil de estrategias mixtas σ ∗ es un equilibrio de Nash si para cada
i ∈ N y cada σ i ∈ Σi tenemos
Eui (σ ∗i , σ ∗−i ) ≥ Eui (σ i , σ ∗−i ).
Como en el caso de estrategias puras, denotemos mediante Ri (σ −i ) la(s) estrate-

gia(s) (mixta) óptima del cada jugador i ∈ N cuando los demás jugadores utilizan
las estrategias mixtas σ −i . Así, un equilibrio de Nash σ ∗ es una solución al sistema
de ecuaciones
σ 1 = R1 (σ −1 )
σ 2 = R2 (σ −2 )
..
.
σ n = Rn (σ −n ).
De nuevo esta formulación nos proporciona un definición más operativa, que nos
orienta en el cálculo de los equilibrios de Nash de un juego.
Puesto que las estrategias puras pueden también representarse como estrategia
mixtas, mantendremos la notación EN (G) para referirnos al conjunto de perfiles de
estrategias (mixtas) que constituyen un equilibrio de Nash del juego G. La propiedad
más importante de la noción de equilibrio de Nash (en estrategias mixtas) es que
todo juego posee un equilibrio. Por supuesto, algunos juegos sólo tienen equilibrios
en estrategias mixtas (como ilustra el ejemplo del juego de Pares/Nones que volve-
mos a discutir a continuación), otros tienen equilibrios en estrategias puras y mixtas
(como el juego de la Batalla de los Sexos), y otros sólo en puras (como el Dilema del
Priosionero).
Ejemplos:
14
1. En el juego del Ejemplo 1, si los jugadores eligen las estrategias σ 1 = (p, 1 − p)
y σ 2 = (q, 1 − q), la utilidad esperada del Jugador 1 es
Eu1 (p, q) = 1 − 2q + 2p(2q − 1).
Por tanto, la Eu1 (p, q) es (1) creciente en p si q > 12 , (2) constante en p si q = 1

2
1
y (3) decreciente en p si q < 2
. En el primer caso, la estrategia óptima del
Jugador 1 es p = 1, mientras que en el segundo cualquier estrategia es óptima
y en el tercero la estrategia óptima es p = 0. Así, su función de reacción es


 si q > 12
 1
R1 (q) = [0, 1] si q = 12


 0 si q < 1 . 2
Análogamente, la utilidad esperada del Jugador 2 es
Eu2 (p, q) = −1 + 2p + 2q(1 − 2p),
y su función de reacción es


 si p > 12
 0
R2 (p) = [0, 1] si p = 12


 1 si p < 12 .
La única solución al sistema de ecuaciones
p = R1 (q)
q = R2 (p)
©¡ ¢ª
es p∗ = q ∗ = 12 . Por tanto EN (G) = ( 12 , 12 ), ( 12 , 12 ) .
2. En el juego del Ejemplo 3, silos jugadores eligen las estrategias σ 1 = (p, 1 − p)

y σ 2 = (q, 1 − q), la utilidad esperada del Jugador 1 es
Eu1 (σ) = pq(1) + (1 − p)(1 − q)(2) = 2 − 2q + p(3q − 2)


 si q > 23
 1
R1 (q) = [0, 1] si q = 23


 0 si q < 23 .
15
La utilidad esperada del Jugador 2 es
Eu2 (σ) = pq(2) + (1 − p)(1 − q)(1) = 1 − p + q(3p − 1)


 si p > 13
 1
R2 (p) = [0, 1] si p = 13


 0 si p < 13 .
El sistema de ecuaciones
p = R1 (q)
q = R1 (p)
tiene tres soluciones (1) p∗ = q ∗ = 1, (2) p∗ = q ∗ = 0, y (3) p∗ = 13 , q ∗ = 23 . Por

© ¡ ¢ª
tanto EN (G) = ((1, 0), (1, 0)) , ((0, 1), (0, 1)) , ( 13 , 23 ), ( 23 , 13 ) .
Estrategias mixtas y estrategias racionalizables: una vez que hemos abierto la

posibilidad de que los jugadores elijan sus acciones de acuerdo con distribuciones de
probabilidad, también tenemos que plantearnos esta posibilidad a la hora de deter-
minar si una estrategia está estrictamente dominada.
Ejemplo 6. Consideremos el siguiente juego en forma normal:
A2 B2 C2
A1 1, 1 2, 2 0, 4
B1 2, 2 1, 1 2, 0
C1 3, 3 0, 2 4, 1
En este juego no hay estrategias estrictamente dominidas de acuerdo con la defini-

ción formulada anteriormente. Sin embargo, la estrategia mixta del Jugador 2 σ 2 =
( 58 , 0, 58 ) proporciona unos pagos
σ2
5
A1 8
(1, 1) + 38 (0, 4) = ( 58 , 17
8
)
5 3 16 10
.
B1 8
(2, 2) + 8 (2, 0) = ( 8 , 8 )
5
C1 8
(3, 3) + 38 (4, 1) = ( 278 8
, 18 )
16
Esta estrategia mixta claramente domina a la estrategia B2
A2 B2 C2 σ2
A1 1, 1 2, 2 0, 4 ( 58 , 17
8
)
.
B1 2, 2 1, 1 2, 0 ( 16
8 8
, 10 )
C1 3, 3 0, 2 4, 1 ( 27
8 8
, 18 )
Una vez eliminada esta estrategia, la eliminación sucesiva de estrategias dominadas

resulta en S ∞ = {(C1 , A2 )}.
Concluimos con una nueva reformulación de la noción de estrategia estrictamente
dominada que incorpora la posibilidad de que una estrategia (pura) esté dominada
por una mixta. Si Ŝ = Ŝ1 × Ŝ2 × · · · × Ŝn , donde Ŝi ⊆ Si , denotamos mediante Σ̂i el
conjunto de estrategias mixtas σ i ∈ Σ tales que solos las estrategias en Ŝi se adoptan
con probabilidad positiva.
Estrategias estrictamente dominadas. Sea Ŝ = Ŝ1 × Ŝ2 × · · · × Ŝn , donde
Ŝi ⊆ Si . Decimos que la estrategia si ∈ Ŝi está estrictamente dominada respecto
a Ŝ si existe una estrategia mixta σ i ∈ Σ̂i tal que para todo s−i ∈ Ŝ−i tenemos
Eui (s0i , s−i ) > Eui (si , s−i ).
17

Apuntes de Teoría de La Decisión y de Los Juegos - Juegos Estáticos

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Apuntes de Teoría de La Decisión y de Los Juegos - Juegos Estáticos

Transféré par

Droits d'auteur :

Formats disponibles

Apuntes de Teoría de la Decisión y de los Juegos:

1 La Teoría de los Juegos

1.1 Juegos cooperativos y no cooperativos

1.2 Juegos estáticos y dinámicos: forma normal y extensiva

2 Juegos Estáticos: forma normal

• Un conjunto de jugadores N = {1, . . . , n}.

• Un conjunto de acciones o estrategias posibles Si para cada jugador i ∈ N.

En la tabla la fila representan la estrategia elegida por el del Jugador 1 y la columna

Ejemplo 4 (Coordinación). Dos napolitanos aparcan sus coches en el mismo garaje

2.2 Racionalidad e Información

2.3 Soluciones a Juegos Estáticos

2.4 Estrategias Racionalizables

Estrategias estrictamente dominadas. Sea Ŝ = Ŝ1 × Ŝ2 × · · · × Ŝn , donde

Como ya hemos discutido, el uso estrategias estrictamente dominadas (respecto

Estrategias racionalizables. Definimos la secuencia {S 0 , S 1 , . . . , S k , . . .} de perfiles

Propiedades de S ∞ . Las dos propiedades básicas del conjunto S ∞ son

2. Si el conjunto de perfiles de estrategias es finito entonces puede calcularse en

Cálculo de S ∞ . Para calcular el conjunto de estrategias racionalizables de un juego

3. Continuar este proceso hasta que en alguna iteración k̄ no se encuentren es-

A continuación aplicamos este procedimiento para encontrar el conjunto de es-

Ejemplos: En los ejemplos 1-4 el conjunto S ∞ se puede calcular fácilmente: en

Ejemplo 5. Consideremos el siguiente juego en forma normal:

1. Cálculo de S 1 : C2 está estrictamente dominada (por A2 ); no hay ninguna otra

Consiguientemente, para k ≥ 3, S k = S 3 = S ∞ = {(C1 , A2 )}.

2.5 Equilibrio de Nash

Escribimos EN(G) para denotar el conjunto de equilibrios de Nash del juego G.

Para mostrar la utilidad de esta formulación para el cálculo de los equilibrios de

1. Consideremos el juego del Ejemplo 1. En la tabla adjunta hemos subrayado la

2. Consideremos el Ejemplo 2. En la tabla hemos subrayado las mejores respuestas

3. Consideremos el Ejemplo 3. En la tabla hemos subrayado las mejores respuestas

4. Consideremos el Ejemplo 4. En la tabla hemos subrayado las mejores respuestas

5. Consideremos ahora el Ejemplo 5. En la tabla hemos subrayado las mejores

Equilibrios de Nash y estrategias racionalizables. Como ilustran los ejemplos,

2.6 Estrategias Mixtas

adopta la estrategia ski ; y puesto que σ i es una distribución de probabilidad, tenemos

Eu1 (σ) = pq(1) + p(1 − q)(−1) + (1 − p)q(−1) + (1 − p)(1 − q)(1)

Y puesto que se trata de un juego de suma cero, tenemos

Eu2 (σ) = −Eu1 (σ) = −1 + 2p + 2q(1 − 2p).

Eu1 (σ) = pq(1) + (1 − p)(1 − q)(2) = 2 − 2q + p(3q − 2).

Y la utilidad esperada del Jugador 2 es

Eu2 (σ) = pq(2) + (1 − p)(1 − q)(1) = 1 − p + q(3p − 1).

Equilibrio de Nash en estrategias mixtas: La noción de equilibrio de Nash se

Eui (σ ∗i , σ ∗−i ) ≥ Eui (σ i , σ ∗−i ).

Como en el caso de estrategias puras, denotemos mediante Ri (σ −i ) la(s) estrate-

Eu1 (p, q) = 1 − 2q + 2p(2q − 1).

Por tanto, la Eu1 (p, q) es (1) creciente en p si q > 12 , (2) constante en p si q = 1

Análogamente, la utilidad esperada del Jugador 2 es

Eu2 (p, q) = −1 + 2p + 2q(1 − 2p),

La única solución al sistema de ecuaciones

2. En el juego del Ejemplo 3, silos jugadores eligen las estrategias σ 1 = (p, 1 − p)

Eu1 (σ) = pq(1) + (1 − p)(1 − q)(2) = 2 − 2q + p(3q − 2)

Eu2 (σ) = pq(2) + (1 − p)(1 − q)(1) = 1 − p + q(3p − 1)

tiene tres soluciones (1) p∗ = q ∗ = 1, (2) p∗ = q ∗ = 0, y (3) p∗ = 13 , q ∗ = 23 . Por

Estrategias mixtas y estrategias racionalizables: una vez que hemos abierto la

Ejemplo 6. Consideremos el siguiente juego en forma normal:

En este juego no hay estrategias estrictamente dominidas de acuerdo con la defini-

Una vez eliminada esta estrategia, la eliminación sucesiva de estrategias dominadas

Vous aimerez peut-être aussi