Vous êtes sur la page 1sur 53

Teora de Juegos:

IO2 Rosa Delgadillo

Teora de juegos









Conceptos
Juego suma cero
Estrategias Puras
Estrategias mixtas
Mtodo grafico
Programacin lineal
Juegos suma constante
Juegos de suma no constante

IO2- Rosa Delgadillo

Conceptos


En la teora de decisin con incertidumbre, se


supone que los estados de la naturaleza, son
los oponentes
En la teora de juegos, trata de decisiones
con incertidumbre, comprendiendo dos o ms
oponentes inteligentes.
Cada oponente aspira a optimizar su propia
decisin a costa de los otros.

IO2- Rosa Delgadillo

Conceptos



Ejemplo donde se aplican


En campaas publicitarias para
productos competitivos
Plan de tcticas destinadas a dos
bandos contrincantes

IO2- Rosa Delgadillo

Conceptos


En la teora de juegos, cada oponente


se conoce como un jugador
Cada jugador tiene un nmero finito o
infinito de estrategias
Los resultados o pagos de un juego se
resume como funciones de las
diferentes estrategias para cada
jugador

IO2- Rosa Delgadillo

Juego suma cero




Un juego con 2 jugadores en donde la


ganancia de uno implica la prdida del
otro se conoce como juego de dos
personas suma cero. Entonces los
resultados se pueden expresar en
trminos del pago de un jugador.

IO2- Rosa Delgadillo

Juego suma cero




Ejemplo: El juego consiste en igualar 2


monedas, cada jugador puede elegir C cara
o S sello.
El jugador A elije C y el jugador B elije S.
Si los resultados de lanzar las dos monedas
son:
(C, C) (S, S) => A gana $1, que paga B
(C, S) (S, C) => A pierde $1 que paga a B

IO2- Rosa Delgadillo

Juego suma cero




Cada jugador tiene 2 estrategias C


S
La matriz de juegos 2 x 2 es:
Jugador B
Juga
dor
A

IO2- Rosa Delgadillo

-1

-1

Estrategias puras


La solucin para el juego puede


necesitar que cada jugador emplee una
estrategia pura estrategias mixtas.
Los problemas de juegos o los juegos
representan problemas de decisin
donde existe falta informacin, pues los
oponentes inteligentes trabajan en un
medio conflictivo.

IO2- Rosa Delgadillo

Estrategias puras


Supuesto: Cada jugador elige una


estrategia que lo posibilita a hacer lo
mejor que puede dado que su oponente

conoce la estrategia que est siguiendo.


(teora de juego . Jhon Von Neumann y Oskar
Morgenstern )


la estrategia que se sigue es


conservadora => el criterio es minimaxmaximin

IO2- Rosa Delgadillo

Estrategias puras


Criterio minimax- maximin: Elegir la


estrategia que proporciona el mejor de
los peores resultados.
El jugador de las filas (jugador A) utiliza
el criterio minimax, esto es maximiza sus
ganancias mnimas
El jugador de las columnas (jugador B)
utiliza el criterio maximin, esto es
minimiza sus mximas perdidas.

IO2- Rosa Delgadillo

Estrategias puras


ejemplo: sea la siguiente matriz de


pagos
Jugador B

Jugador A

18

-4

10

mx.

IO2- Rosa Delgadillo

18

min
2
5
-4

Estrategias puras


Solucin ptima: se alcanza cuando


ninguno encuentra beneficio en alterar
su estrategia, esto es el juego es
estable o esta en estado de equilibrio.

IO2- Rosa Delgadillo

Estrategias puras


La ganancia correspondiente al jugador


A, Vmaxmin, se conoce como valor
maximin (o inferior) del juego.
La ganancia correspondiente al jugador
B, Vminimax, se conoce como valor
minimax (o superior) del juego.
Esto es, Vminimax >= V >= Vmaxmin

IO2- Rosa Delgadillo

Estrategias puras
Punto Silla: si Vminimax = Vmaxmin.
Si el juego tiene punto silla => las
estrategia puras son ptimas y el valor
del juego (V) es:
V=Vminimax = Vmaxmin.


IO2- Rosa Delgadillo

Estrategias puras


La Optimalidad significa que ningn


jugador debe cambiar su estrategia
pues su oponente puede contrarrestar
eligiendo otra estrategia que
proporcione pagos menos atractivos.

IO2- Rosa Delgadillo

Estrategias mixtas


Cuando no es posible conseguir la


estabilidad del juego utilizando
estrategias puras, entonces es
necesario utilizar el concepto de
estrategias mixtas.

IO2- Rosa Delgadillo

Estrategias mixtas


Ejemplo:
jugador B

Jugador A

1
2
3
4
mx.

1
5
6
8
3
8

2
-10
7
7
4
7

3
9
8
15
-1
15

4
0
1
2
4
4

min.
-10
1
2
-1

Se observa que cada jugador mejora su pago eligiendo una


estrategia diferente => el juego es inestable
IO2- Rosa Delgadillo

Estrategias mixtas
En este caso, cada jugador puede jugar
todas sus estrategias de acuerdo con un
conjunto predeterminado de
probabilidades, esto es, se asocia a
cada estrategia del jugador las
probabilidades:

IO2- Rosa Delgadillo

Estrategias mixtas
Sean x1, x 2,....xm las probabilidades asociadas a las
estrategias del jugador A (jugador de la filas) y
y1, y 2 ,.... yn las probabilidades asociadas a las estrategias
del jugador B (jugador de las columnas)
m
n
=>
x =
y =1
x ,y 0
i, j

i =1

j=

entonces se tiene

IO2- Rosa Delgadillo

x1

y1
a11

y2
a12

...
...

yn
a1n

x2
...
xm

a 21
..
a m1

a 22 ... a 2 n
.. ... ..
a m 2 ... a mn

Estrategias mixtas
Se usa tambin el criterio MinMax
Esto es:
A : Elige xi la cual maximiza el pago
esperado mas pequeo en una columna
( xi 0,

Donde:
m

m
max min
ai1 xi , ai 2 xi ,.....,

xi
i =1
i =1

IO2- Rosa Delgadillo

ain xi

i =1

= 1)

Estrategias mixtas
B : Elige y j la cual minimiza el mayor
pago esperado en una fila
Donde:

min max

yj

( y j 0,

= 1)

a1 j y j , a 2 j y j ,.....,
a mj y j

j =1
j =1
j =1

Se verifica que:
pago esperado minimax>= pago esperado maximin
IO2- Rosa Delgadillo

Estrategias mixtas
y *j

xi*

Teorema: si
y
son soluciones
ptimas para ambos jugadores Cada
elemento de pago estar asociado a la
probabilidad por consiguiente el valor
esperado ptimo del juego es:
m

V =
*

i =1 j =1

IO2- Rosa Delgadillo

aij xi* y *j

Mtodo grfico
Juegos 2 x n : en este caso es posible
calcular los pagos esperados del
jugador A con respecto a las estrategias
puras del jugador B y luego trazar las
rectas para determinar el valor del
juego.

IO2- Rosa Delgadillo

Mtodo grfico
Juegos 2 x n :
sea
A

y1

y2

...

yn

x1

a11

a12

... a1n

x2

a 21

a 22 ...

a 2n

como x2 = 1 x2 se tiene
Pagos esperados de A

1
Estrategias
puras de B

IO2- Rosa Delgadillo

(a11 a21 ) x1 + a21

2 (a12 a 22 ) x1 + a22
..
...
n (a1n a 2 n ) x1 + a 2 n

Es lineal

Mtodo grfico
Trazar las rectas como funciones de xi para
determinar determinar el valor de xi que maximiza los
mnimos pagos esperados (Jugador A: maximin)
Ejemplo:
B

1 2 3
A

IO2- Rosa Delgadillo

1 2 2 3 1
2 4 3 2

Mtodo grfico
Dado que el juego no tiene punto silla, se calcula
Pagos esperados de A
4

1
Estrategias
puras de B

2 x1 + 4

2 x1 + 3
3
x1 + 2
4 7 x1 + 6

IO2- Rosa Delgadillo

2
3

Maxmin

Mtodo grfico
xi las rectas
el maxmin ocurre en la interseccin de
2,3 y 4 , de donde x 1 = 1 / 2 , sustituyendo en
cualquier recta que pasa por maxmin se tiene el valor
del juego
La estrategia ptima de A es
x1* = 0.5, x2* = 0.5 y

IO2- Rosa Delgadillo

V * = 5/ 2

Mtodo grfico
Para obtener la estrategia ptima para B, se observa
las 3 rectas que pasan por maximin (2, 3 y 4), esto
es B puede combinar cualquiera de las tres.
por tanto las rectas (2,3) (2,4) (3,4), son las
posibles estrategias a combinar, se excluye (2,4)
pues tienen pendientes del mismo signo y esto no
garante que sea una solucin optima alternativa.
Si tomamos las rectas (2,3), implica que
y3 = 1 y 2
y1* = y 4* = 0 y

IO2- Rosa Delgadillo

Mtodo grfico
Calculando los pagos de B
Pagos esperados de B
Estrategias
puras de A

Se obtiene

1 y2 + 3
2

y2 + 2

y 2* = 0.5, y3* = 0.5 y

V * = 5/ 2

La combinacin (3,4) producir

y3* = 0.875, y 4* = 0.125 y

V * = 5/ 2

Un promedio ponderado de (2,3) y (3,4), tambin proporciona una


nueva solucin ptima que mezcla las estrategias 2,3 y 4
IO2- Rosa Delgadillo

Mtodo grfico
trazamos las 4 rectas
4

Minmax
1
2
3

de donde

IO2- Rosa Delgadillo

y1* = 2 / 3, y 2* = 1 / 3 y

V * = 8/3

Mtodo grfico
Para el jugador A, se observa que el punto minmax
corresponde a las estrategias puras 1 y 3 de A
x2* = x4* = 0

y x3 = 1 x1
Pagos esperados de A

Estrategias
puras de B

1 x1 + 3
2 2 x1 + 2

De donde la estrategia ptima e A es:

x1* = 1 / 3, x2* = 0, x3* = 2 / 3, x4* = 0 y

IO2- Rosa Delgadillo

V * = 8/3

Programacin Lineal
El problema del jugador A, se puede escribir de la siguiente forma:
m

m
max min
a i1 xi ,
a i 2 x i ,.....,

xi
i =1
i =1

s.a
x1 + x 2 + .... + x m = 1

x i 0,

Si hacemos

IO2- Rosa Delgadillo

i =1


a in xi

i = 1, 2,..., m

m
m
v = min
ai1 xi , ai 2 xi ,.....,

i =1
i =1

ain xi

i =1

Programacin Lineal
Entonces el problema del jugador A, se puede escribir como un
PPL.
max Z = V
s .a
m

a ij x i ,

j = 1 , 2 ,..., n

i =1

xi = 1

i =1

xi 0,

Donde V representa el valor del juego

IO2- Rosa Delgadillo

Programacin Lineal
El problema del jugador B, se puede escribir de la siguiente forma:

min max

xi

s.a


a1 j y j ,
a 2 j y j ,.....,
a mj y j

j =1
j =1
j =1

n

y1 + y 2 + .... + y n = 1
y j 0,

Si hacemos

IO2- Rosa Delgadillo

y = 1, 2,..., n

w = max

a1 j y j , a2 j y j ,.....,
a mj y j

j =1
j =1
j =1

Programacin Lineal
Entonces el problema del jugador B, se puede escribir como un
PPL.
min Z = W
s .a
n

a ij y

W ,

i = 1 , 2 ,.... m

j =1
n

0,

= 1

j =1
j

Donde W representa el valor del juego

IO2- Rosa Delgadillo

Programacin Lineal
Observe: que el Problema del jugador B es el dual del problema del
jugador A.
La solucin del problema de A proporciona la solucin del
problema de B
el problema de B se resuelve con simplex regular
el problema de A se resuelve con Simplex dual
La eleccin de un mtodo u otro depende de que el problema
tenga Un nmero ms pequeo de restricciones ( nmero de
estrategias puras para un jugador)

IO2- Rosa Delgadillo

Programacin Lineal
Ejercicio: Dos jugadores dicen simultneamente 3 palabras piedra,
papel tijeras, y hacen seales correspondientes con las manos,
si ambos jugadores dicen lo mismo, entonces el juego se
empata, si no sucede as, un jugador gana 1 dlar al otro
jugador.
Solucin: la matriz de recompensa es
B

No hay punto silla


IO2- Rosa Delgadillo

piedra

piedra
0

papel tijera min


1
1
1

papel
tijera

1
1

0
1

1
0

max

1
1

Programacin Lineal
El PPL para jugador A:
max

s .a .
V

, x

, x
V

Resuelva y confiera que

IO2- Rosa Delgadillo

nrs

x1* = x2* = x3* = 1 / 3 y V = 0

Programacin Lineal
El PPL para jugador B:
min

s .a
W

IO2- Rosa Delgadillo

, y

, y

Al resolver obtiene

y
+

+
3

y
3

y
y

nrs

y1* = y 2* = y3* = 1 / 3 y W = 0

Dominancia
Definicin: Sea dos vectores A = (a1 , a2 ,...., an ) y B = (b1 , b2 ,...., bn ) se dice
que A domina B, si cada componente de A es estrictamente
mayor o igual a su correspondiente componente en B, esto es
a j bj

Ejemplo: sean los siguientes vectores


B domina A
A = (1,1,1)
C domina A
B = (1 / 2, 0, 0)
B y C son no dominados
C = (0, 1, 0)

IO2- Rosa Delgadillo

Dominancia
A = (a1 , a2 ,...., iande
) un
B =jugador
(b1 , b2 ,...., bdado
Dominancia en juegos: Una estrategia
es
n)
dominada por una estrategia i , si para cada una de las otras
estrategias posibles del jugador; el jugador si domina por lo
menos tambin con la estrategia i como lo hace con la
estrategia i y si para al menos una de las otras estrategias del
jugador, i es superior a la estrategia i
Un jugador puede dejar de considerar todas sus
estrategias dominadas

IO2- Rosa Delgadillo

Dominancia
Ejemplo: Sea la siguiente matriz de recompensas de dos jugadores
AyB

A1
A2
A3

B1
40
38
28

B2
34
35
33

B3
30
36
35

B4
33
37
38

El jugador A no tiene ninguna


estrategia dominada, observemos
para el jugador B

Dado que, B busca minimizar la mxima perdida, entonces B3 domina


B4 luego se elimina columna 4
A1
A2
A3
IO2- Rosa Delgadillo

B1
40
38
28

B2
34
35
33

B3
30
36
35

B4
33
37
38

Dominancia
En la matriz reducida observe las estrategias del jugador A
Como A, busca maximizar su
B1 B2 B3 B4
minima ganancia, entonces la
A1 40 34 30 33
estrategia A2 domina a la
A2 38 35 36 37
estrategia A3
A3

28 33

35

38

Por lo que la matriz queda

A1
A2
A3

B1
40
38
28

B2
34
35
33

B3
30
36
35

B4
33
37
38

Repetir sucesivamente, hasta que no sea posible reducir mas la matriz.


IO2- Rosa Delgadillo

Juego suma constante para dos personas


Es un juego en donde participan dos personas en el cual para
cualquier eleccin de las estrategias de ambos jugadores, la
recompensa del jugador A y la recompensa del jugador B suman
un valor constante
es un juego suma cero donde la constante es=0
Los jugadores estn en conflicto pues el incremento en una
unidad de la recompensa del jugador A ocasiona que disminuya
en esa unidad la recompensa del jugador B
Se aplica los mtodos de suma cero para dos personas

IO2- Rosa Delgadillo

Juego suma constante para dos personas


Ejemplo: dos canales de TV. Compiten por la audiencia de 100
millones de televidentes durante la hora punta de 8:00 a 9:00
pm. Los canales anuncian en forma simultanea el tipo de
programa que mandarn al aire en esa hora. Las elecciones
posibles para cada TV y el nmero de televidentes (millones) se
da en la siguiente tabla
pelicula telenovela comedia
pelicula
telenovela
comedia

IO2- Rosa Delgadillo

35
45
38

15
58
14

60
50
70

Juego suma constante para dos personas


Solucin:
pelicula
telenovela
comedia
max

pelicula telenovela comedia min


15
35
15
60
45
38
45

58
14
58

50
70
70

45
14

Como c= 100 millones de televidentes


La solucin es canal 1, transmite telenovelas y canal 2 pasa pelculas, el
valor del juego es que canal 1 consigue una audiencia de 45 millones y
canal 2 una audiencia de 55 millones de televidentes

IO2- Rosa Delgadillo

Juego suma constante para dos personas


Resumen de cmo resolver un juego de suma constante:
Paso 1: Verificar si hay puno silla, si el juego no tiene punto silla
pase al paso2
Paso 2: Elimine cualquier estrategia dominada del jugador A.
inspeccione la matriz reducida y elimine cualquier estrategia
dominada del jugador B, as sucesivamente.
Paso 3: Si la matriz reducida de juegos es de 2 x n m x 2,
resuelva por el mtodo grafico, en caso contrario utilice
programacin lineal

IO2- Rosa Delgadillo

Juego suma no constante para 2 personas


La mayor parte de los modelos de juegos para situaciones
financieras no son juegos de suma constante, porque es inusual
que los competidores comerciales estn en conflicto total. Esto
es, pueden cooperar.
Problema del dilema del prisionero:
Dos prisioneros escaparon y participaron en un robo, han sido recapturados y esperan el juicio
sobre el nuevo delito. Ambos son culpables pero no hay suficiente evidencia para
condenarlos. El fiscal para hacer que cada uno testifique en contra del otro, le dice a cada
prisionero. si solo uno de Uds. Confiesa y testifica contra su compaero, el que confiesa
quedara libre, en tanto que el que no confiese quedar condenado a 20 aos de crcel. Si
ambos confiesan, entonces ambos sern condenados y enviados a prisin por 5 aos. Por
ltimo si ninguno confiesa, yo puedo condenar a ambos por un delito menor y pasar cada
uno un ao de prisin
qu debe hacer el prisionero?

IO2- Rosa Delgadillo

Juego suma no constante para 2 personas


Solucin: se supone que los prisioneros no se pueden comunicar
entre si. Entonces las estrategias y recompensas son:
confiesa
noconfiesa

confiesa noconfiesa
(5,5)
(0,20)
(20,0)

(1. 1)

Observe: las recompensas varan desde -2 hasta -20 => no es juego suma
constante
Si cada prisionero decide eliminar su estrategia dominada => confesar
domina a no confesar => c/prisionero pasa 5 aos en prisin.
en tanto que si c/ prisionero escoge su estrategia dominada no confesar
=> c/ prisionero pasar solo 1 ao en prisin

Por lo que estn mejor si ambos eligen su estrategia dominada.


IO2- Rosa Delgadillo

Juego suma no constante para 2 personas


Punto de equilibrio: Una eleccin de estrategia por parte de cada
jugador es un punto de equilibrio si ninguno de los jugadores
puede beneficiarse al hacer un cambio unilateral en estrategia
confiesa
noconfiesa

confiesa noconfiesa
(5,5)
(0,20)
(20,0)

(1. 1)

=> en el ejemplo (-5,-5) es punto de equilibrio


y (-1, -1) no es punto de equilibrio
Obs: si ambos jugadores cooperan( no confiesan) => c/ uno puede
ganar al traicionar a su cmplice, si ambos se traicionan, estn
ambos en peor situacin
IO2- Rosa Delgadillo

Juego suma no constante para 2 personas


Formalmente: el juego puede representarse como
NC

NC ( P, P) (T , S )
C

NC= no cooperar
C = cooperar

IO2- Rosa Delgadillo

( S , T ) ( R, R )

P= Castigo por no cooperar


S= pago al jugador que es traicionado
T = Tentacin de traicionar a su cmplice
R = recompensa por cooperar

Juego suma no constante para 2 personas


Observe: que
NC

NC ( P, P) (T , S )
C

( S , T ) ( R, R )

como el punto de equilibrio es (P,P) , se requiere que P >S


Para que (R,R) no sea punto de equilibrio se requiere que T>R
El juego es razonable si R>P
=> T>R>P>S
El dilema del prisionero, explica la razn de que dos adversarios no
cooperen con frecuencia entre si.
IO2- Rosa Delgadillo

Vous aimerez peut-être aussi