Conceptos de Solucion de Juegos

Teoría de Juegos
Conceptos de solución
 El hecho de que en cualquier problema de teoría de
juegos existan distintos decisores con intereses
generalmente contrapuestos, hace que el concepto de
solución deba ser matizado con respecto al que existe en
la Programación Matemática tradicional.
 Parece claro que muy rara vez existirá una combinación
de estrategias que sea lo mejor para todos, en el sentido
matemático de que maximice los pagos recibidos por
todos los jugadores que intervienen.
 La adaptación del concepto de solución a los problemas
de teoría de juegos da lugar a los distintos tipos de
equilibrio.
2
 El concepto de equilibrio parece indicar una situación en la
que todos los jugadores se sienten, de alguna forma, cómodos,
en el sentido de que, alcanzado este punto, ninguno tiene
incentivos para cambiar de estrategia, porque puede que este
cambio les condujese a situaciones peores. Así pues, en sentido
amplio, el equilibrio no produce necesariamente el mejor
resultado posible para cada jugador individual, pero es una
situación que conforma a todos ante la amenaza de resultados
peores.
 Son varios los conceptos de equilibrio que se usan en teoría
de juegos. Nosotros nos centraremos en este apartado en dos
conceptos: el equilibrio en estrategias dominantes y el más
importante y utilizado en la literatura, el equilibrio de Nash (o
de Nash-Cournot).
3
 Equilibrio en estrategias dominantes.
 La racionalidad de los jugadores que intervienen en el juego es
una suposición básica dentro del desarrollo de la teoría. Esta
racionalidad parece llevar a una conclusión inmediata: ningún
jugador escogerá una estrategia que le proporcione peores
pagos que otra, para cualquier combinación de estrategias que
escojan el resto de los jugadores.
 Esta idea da lugar al concepto de estrategia dominada, y éste a
su vez, al de equilibrio en estrategias dominantes.
 Además, es una suposición lógica que cada jugador eliminará
sus estrategias dominadas previamente a hacer cualquier otra
consideración sobre el juego.
 Esta suposición dará lugar al método de eliminación iterativa
de estrategias dominadas.
4
 Vamos ahora por tanto a definir formalmente el concepto
de estrategia dominada.
Para ello, emplearemos la siguiente notación:
para cada s S y cada ui Si, llamamos:
s\ui ≡ (s1, ..., si-1, ui, si+1, ..., sn),
 es decir, s\ui es la combinación de estrategias que resulta
al sustituir si por ui en S. Esta notación se utilizará para
poder considerar casos en los que variamos la estrategia
de un jugador determinado, manteniendo el resto de los
jugadores constantes las suyas.
5
 Definición 2
 La estrategia
si’ Si se dice que es una estrategia débilmente dominada
para el jugador i si existe alguna si’’ Si tal que Pi (s\ si’’)
≥ Pi(s\ si’) para cualquier s S. Si Pi (s\si’’) > Pi(s\ si’) para
todo s S, entonces si’ es fuertemente dominada.
6
 Así pues, una estrategia débilmente dominada nunca será
elegida por un jugador racional, ya que existe otra que
produce pagos al menos tan buenos como ésta, sea cual
sea la combinación de estrategias del resto de los
jugadores. De la misma forma, parece claro que un
jugador escogería, si existiese, una estrategia que
dominase a todas las demás:
7
 Definición 3.
 La estrategia si’ se dice que es una estrategia débilmente
dominante para el jugador i si para cualesquiera s S y si
’’ Si, se verifica que Pi(s\ si’) ≥ Pi (s\ si’’). Si, para
cualesquiera s y si’’ se verifica que Pi(s\ si’) > Pi(s\ si’’),
entonces se dice que si’ es fuertemente dominante.
8
 Es importante tener en cuenta que un jugador no
necesariamente tiene estrategias dominantes (el que una
estrategia no sea dominada no implica que sea
dominante).
 En el caso especial en que cada jugador tuviera una tal
estrategia, la combinación de estrategias formada por
todas ellas daría lugar a una situación de equilibrio, el
equilibrio en estrategias dominantes:
9
 Definición 4.
En un juego Γ = (N, S, P), s* S es un equilibrio en
estrategias dominantes si para cada i N, s es una
estrategia dominante.
10
 Para ilustrar estos conceptos, vamos a recurrir al
conocido dilema de los presos.
 Dos sospechosos son arrestados y acusados de un delito.
 La policía no tiene evidencias suficientes para condenar a
los sospechosos al menos que uno confiese, por lo que
encierra a los sospechosos en celdas separadas y les
explica las consecuencias de las decisiones que tomen.
 Si ninguno confiesa, ambos serán condenados por un
delito menor, y sentenciados a un mes de cárcel. Si ambos
confiesan, serán sentenciados a seis meses de cárcel.
11
 Finalmente, si uno confiesa y el otro no, el que confiesa
será puesto inmediatamente en libertad, y el otro será
sentenciado a nueve meses de prisión: seis por el delito y
tres más por obstrucción a la justicia.
12
 Este problema se puede representar en forma estratégica
mediante la siguiente matriz de pagos:
Preso 2
Estrategia Callar Confesar
Callar -1, -1 -9, 0

Preso 1
Confesar 0, -9 -6, -6
13
 Así pues, cada jugador posee dos estrategias puras: callar
y confesar. Puede observarse que la estrategia confesar es
dominante para cada jugador. En efecto, para el jugador 1,
por ejemplo, si 2 escoge callar, éste confesará, ya que será
puesto en libertad en vez de pasar un mes en prisión. Por
otro lado, si 2 confiesa, 1 también lo hará, y pasará 6
meses en prisión, en lugar de 9. El mismo razonamiento
es válido para el jugador 2.
14
 Por tanto, la combinación de estrategias (confesar, confesar) es
un equilibrio en estrategias dominantes, y, por tanto, no parece
haber duda sobre la elección de ambos jugadores. El pago que
obtienen con esta combinación es (-6, -6), es decir, cada uno
pasará 6 meses en prisión.
 El dilema consiste en que ambos jugadores conseguirían
mejores pagos si ambos eligiesen callar. En efecto, en este caso,
ambos pasarían tan sólo un mes en prisión. Pero este punto no
es factible que se alcance, ya que si un preso calla, el otro
obtiene un mejor resultado confesando, ya que en este caso
sería puesto en libertad. Así, si un preso calla, se arriesga muy
probablemente a pasar 9 meses en prisión.
15
 Nótese que el origen de este dilema no es la falta de
comunicación entre los presos. Incluso si pudiesen hablar
y acordar no confesar, cada uno tendría el incentivo de
romper el trato a expensas del jugador que lo mantenga.
Por tanto, un acuerdo consistente en callar no es creíble.
16
 Es importante recalcar que un equilibrio de esta forma
sólo se puede anticipar como solución del juego, es decir,
como la combinación de estrategias que finalmente
elegirán los jugadores, si todos ellos poseen toda la
información y saben que los demás también la poseen,
luego en una situación de información completa (cada
jugador conoce todos los elementos de la tabla), donde
además, cada jugador sabe que el otro tiene toda la
información y que va a actuar racionalmente, y cada
jugador sabe que el otro sabe que él tiene toda la
información, y así sucesivamente
17
 Por regla general, es infrecuente que en un juego exista
equilibrio en estrategias dominantes. Sin embargo, el hecho
racional de que cada jugador eliminará sus estrategias
dominadas da lugar al llamado método de eliminación iterativa
de estrategias dominadas.
 Sea, por ejemplo, el juego abstracto representado en forma
estratégica por la siguiente matriz de pagos:
Jugador 2
Estrategia Izquierda Centro Derecha

Alta 1, 0 1, 2 0, 1
Jugador 1
Baja 0, 3 -6, -6 2, 0
18
 El jugador 1 tiene dos estrategias puras: alta y baja, y el jugador 2 tiene tres:
izquierda, centro y derecha. Se puede observar que ningún jugador posee
estrategias dominantes. Además, para el jugador 1, ninguna de sus
estrategias está dominada, pero se puede observar que para el jugador 2, la
estrategia derecha está dominada por centro, por lo que nunca elegirá esta
opción. Si además el jugador 1 sabe que el 2 es racional y nunca elegirá esta
estrategia, ambos se pueden comportar como si ésta no existiera,
eliminando, la correspondiente columna, y dando lugar al juego:
Jugador 2
Estrategia Izquierda Centro

Alta 1, 0 1, 2
Jugador 1
Baja 0, 3 -6, -6
19
 Pero en este juego, ahora la estrategia alta domina a baja
para el jugador 1, por lo que, siguiendo el mismo
razonamiento que antes, podemos eliminar esta última,
pasando entonces a la nueva tabla:
Jugador 2
Estrategia Izquierda Centro

Jugador 1 Alta 1, 0 1, 2
 Finalmente, izquierda está dominada por centro para el

jugador 2, quedando por tanto (Alta, Centro) como el
resultado del juego.
20
 Así pues, se ha alcanzado un equilibrio en el juego original,
aplicando iterativamente la idea de que ningún jugador
racional escogerá estrategias dominadas. Este método
tiene el obvio inconveniente de que no tienen por qué
existir estrategias dominadas en los distintos pasos que se
siguen, por lo que no es una técnica que se pueda aplicar
siempre.
21
Equilibrio de Nash
 Si volvemos al ejemplo, podemos ver que el equilibrio
(Alta, Centro) que se encontró con el proceso de
eliminación iterativa de estrategias dominadas tiene una
característica que resulta muy importante: supuesto que
un jugador mantenga su estrategia, el otro no tiene
incentivos para cambiar la suya, ya que si lo hiciera nunca
aumentaría su pago.
22
Equilibrio de Nash
 Se puede observar en la matriz de pagos del juego
original que si el jugador 2 se mantiene en la estrategia
Centro, entonces el 1 no desea cambiar, ya que con la
combinación (Baja, Centro) obtendría un pago de 0, en
vez de 1. Por su parte, si 1 mantiene la suya en Alta,
entonces 2 tampoco desea cambiar, ya que obtendría 0
con Izquierda y 1 con Derecha, en vez de 2, que obtiene
actualmente.
 Esta característica es la que define a lo que llamamos
equilibrio de Nash
23
 Definición 5
Un equilibrio de Nash es una combinación de
estrategias s* S tal que,
para cualesquiera si Si e i N,
se verifica: Pi(s*) ≥ Pi(s*\si)
24
 Aunque este concepto generaliza al de equilibrio en
estrategias dominantes (lo que es obvio por la definición de
ambos), y además se verifica que todo equilibrio conseguido
mediante el método de eliminación iterativa de estrategias
dominadas también es un equilibrio de Nash, aún así no todo
juego tiene necesariamente un equilibrio de Nash en
estrategias puras o mixtas. Sea, por ejemplo, el siguiente juego:
Jugador 2

Alta 1, 0 1, 2 0, 3
Jugador 1
Baja 0, 3 0, 1 2, 0
25
 Puede observarse que en cualquier situación algún jugador tiene incentivos
para cambiar de estrategia si el otro mantiene la suya, y, por tanto, este
juego no tiene equilibrios de Nash en estrategias puras.
 En caso de que el juego tenga equilibrio, si éste es único, es intuitivamente
plausible que los jugadores racionales actuarían de acuerdo con él. Pero
puede suceder que un juego tenga varios equilibrios. Por ejemplo,
considérese la siguiente tabla:
Jugador 2

Alta 0, 10 8, 8 -6, 7
Jugador 1
Baja -2, 3 15, 4 3, 5
26
 Este juego tiene dos equilibrios de Nash: (Alta, Izquierda) y
(Baja, Derecha). Los vectores de pagos respectivos son (0, 10)
y (3, 5), por lo que ninguno de estos equilibrios está dominado
por el otro. En un caso como éste, las condiciones de
equilibrio se pueden considerar como condiciones necesarias
para una solución del juego.
 Los equilibrios de Nash tienen otra característica importante,
que los relaciona con otros conceptos de equilibrio que se
usan en la literatura, como son los de estrategia maximin o
punto de silla, que son análogos a los desarrollados en la
sección dedicada al estudio de la dualidad en Programación
Matemática. En concreto, cualquier equilibrio de Nash
proporciona a cada jugador un pago que es al menos tan
bueno como el mayor valor que cada jugador le puede
garantizar.
27
)
 Lema 1
Cualquier equilibrio de Nash S*, satisface para todos los
jugadores i N que:
28
29
 Según hemos visto anteriormente, cualquier juego no tiene
necesariamente equilibrios de Nash, y mucho menos en
estrategias puras.
 El siguiente teorema demuestra que un equilibrio tal siempre
existe en el caso en que el juego sea de información perfecta
(es decir, donde cada conjunto de información consta de un
único nodo).
 Previamente, vamos a establecer algunas notaciones: Para cada
d D, denotamos por F1(d, k) el nodo que se alcanza cuando
se realiza el k-ésimo movimiento a partir del nodo d. De esta
forma, e1[F1(d, k)] = d y, para cualquier d Iij, e1-1(d) = {F1(d, 1),
..., F1(d, mij)} = F1(d) es el conjunto de nodos sucesores de d.
Estamos ya en condiciones de enunciar el teorema:
30
 Teorema 1.
Cualquier juego finito con información perfecta tiene al
menos un punto de equilibrio en estrategias puras.
31
 Demostración.
 Con las notaciones previamente establecidas, sea E1 = {d D /
F1(d) T}, y sea también T1 = T E1. E1 es, por tanto, el
conjunto de nodos de decisión a partir de los cuales el
siguiente movimiento conducirá necesariamente a un nodo
terminal.
 En cada nodo de E1, se selecciona el movimiento que maximiza
el pago del jugador al que corresponde el nodo.
 Si este movimiento no es único, se escoge entonces aquel que
tiene un índice más bajo. Así pues, cada nodo d E1, tiene
asociado un único nodo terminal td y, a través de él, un único
vector de pagos p(td). La función de pagos p se puede
extender entonces desde T hasta T1, asignando p(d) ≡ p(td) para
cada d E1.
32
 Se puede repetir entonces este proceso recursivamente:
llamamos T0 ≡ T, y suponemos ya definidos Tk-1 y Ek-1, así
como que la función p ya se ha extendido al conjunto Tk-1
= Tk-2 Ek-1. Sean entonces
Ek = {d D / F1(d) Tk-1},
y Tk = Tk-1 Ek. En cada nodo de Ek, cualquier movimiento
conduce a un nodo que tiene ya asignado un único vector
de pagos. En cada uno de ellos, seleccionamos
nuevamente el movimiento que maximiza el pago del
jugador al que pertenece el nodo, y, en caso de empate,
tomamos el de menor índice. Este proceso recursivo
debe terminar en un número finito de pasos, al llegar al
nodo inicial d0.
33
 La colección de nodos en los que mueve el jugador i, y los
movimientos que se deben escoger en ellos, según el
proceso descrito, forman una descripción completa de
una estrategia pura πi* del jugador i. Denotemos por π* la
combinación de estrategias asociada.
 Es claro entonces, por construcción de esta combinación
de estrategias que no existe ningún nodo en el que el
jugador correspondiente pueda conseguir (cambiando de
movimiento o introduciendo aleatorización) aumentar su
pago, ni tampoco ningún jugador puede obtener un pago
mejor aleatorizando sobre sus estrategias puras.
 Por lo tanto, π* es un equilibrio de Nash del juego.
34
 Este método constructivo con el que se obtiene un punto
de equilibrio en un juego con información perfecta
consiste por tanto en empezar por el final del juego y
marchar hacia atrás hasta su principio. Por esta razón, esta
técnica se denomina a veces inducción hacia atrás. El
método lo utilizó ya Zermelo en 1912 para analizar el
ajedrez, por lo que también se denomina Algoritmo de
Zermelo.
35
 Vamos a ver un sencillo ejemplo de su utilización. En la
figura siguiente se puede observar que hemos marcado
con una línea más gruesa aquellos movimientos que
conducen a un mejor pago para el jugador 2 a partir de
los nodos que preceden en un movimiento a los
terminales. Se puede ver por tanto que el jugador 2
maximizará su pago eligiendo la estrategia derecha en el
primer nodo, e izquierda en el segundo.
36
37
 A partir de ella, podemos considerar para el jugador 1 la
siguiente figura, en la que asociamos a cada posible
movimiento suyo el vector de pagos al que se llegará al
final del juego:
38
 El jugador 1 escogerá por tanto la estrategia izquierda,
que es la que maximiza su pago. Así pues, el punto de
equilibrio de Nash que se alcanza es la combinación de
estrategias π* = (i, (d, i) ), para la que el jugador 1 obtiene
un pago de 2 unidades, y el 2 de 1 unidad.
 Recuérdese que tanto el teorema como el algoritmo son
sólo válidos cuando el juego sea de información perfecta.
En efecto, se puede ver claramente que cuando existan
conjuntos de información que contengan más de un nodo,
el método ya no es factible, ya que el jugador
correspondiente no sabe exactamente en qué nodo está,
por lo que no puede maximizar su pago.
39
 Existen en la literatura más conceptos de equilibrio, entre los que cabe mencionar
los diversos refinamientos del concepto de equilibrio no cooperativo de Nash.
Aunque no vamos a entrar de lleno en ellos, vamos, mediante un ejemplo a motivar
su existencia y a esbozar su definición.
 Consideremos el juego abstracto representado en forma extensiva como sigue:
40
 Puede observarse que el juego posee dos equilibrios en
estrategias puras, que son:
π1* = (i, (d, d) ), y π2* = (d, (i, d) ).
 El primero de ellos es el equilibrio que se obtiene
aplicando el algoritmo de Zermelo (que se puede aplicar
por tratarse de un juego con información perfecta).
41
 Vamos a estudiar el segundo. En primer lugar, vemos que es,
efectivamente, un punto de equilibrio: en efecto, si 1 escoge
derecha, entonces el jugador 2 mantiene su utilidad si cambia
de movimiento en el primer nodo, y la disminuye si cambia en
el segundo. Por otro lado, si el jugador 2 mantiene su
estrategia, el 1 obtendría un pago peor si escogiese izquierda.
Por tanto, estamos efectivamente ante un punto de equilibrio,
pero con alguna particularidad extraña.
 En concreto, el jugador 2 escogería izquierda si 1 escoge
izquierda, lo cual parece un movimiento ilógico, puesto que en
esta situación obtendría un mayor pago eligiendo derecha. Este
equilibrio lo es porque de hecho, el jugador 1 no va a escoger
izquierda, por lo que esta situación no se va a dar.
 ¿Qué interpretación se le puede dar a este equilibrio?
42
 ¿Qué interpretación se le puede dar a este equilibrio?
 Supongamos que los jugadores son autorizados a conversar
antes de empezar el juego y que el jugador 2 informa al 1 de
que va a tomar esta estrategia.
 Es decir, el jugador 2 amenaza al 1 con escoger izquierda si él
mueve izquierda en el primer nodo. De todas formas, esta
amenaza es increíble, porque si el jugador 1 escogiera
izquierda, el 2 no se vería beneficiado si cumpliera su amenaza,
ya que obtendría un mayor pago eligiendo derecha
43
 Los distintos refinamientos del concepto de equilibrio de Nash
intentan eliminar casos como el que se ha expuesto
previamente, es decir, que conllevan algún tipo de situación no
creíble.
 En el ejemplo anterior, se puede ver que la combinación de
estrategias π2* no es un equilibrio si se considera sólo sobre el
subjuego que comienza en el nodo de la izquierda del jugador
2.
 Sin embargo, el equilibrio π1* lo es también sobre cualquier
subjuego del juego original. Uno de los refinamientos del
concepto de equilibrio, el equilibrio perfecto en subjuegos,
exige que la combinación de estrategias sea un equilibrio sobre
cualquier subjuego del juego original.
44
INCOMPLETE
45

Conceptos de Solucion de Juegos

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Conceptos de Solucion de Juegos

Transféré par

Droits d'auteur :

Formats disponibles

Teoría de Juegos

Estrategia Callar Confesar

Callar -1, -1 -9, 0

Estrategia Izquierda Centro Derecha

Estrategia Izquierda Centro

Estrategia Izquierda Centro

 Finalmente, izquierda está dominada por centro para el

Estrategia Izquierda Centro Derecha

Estrategia Izquierda Centro Derecha

Vous aimerez peut-être aussi