Vous êtes sur la page 1sur 36

Prof. Ing. Claudio L. R.

Sturla
REPBLICA ARGENTINA
FRBA TEORA DE
JUEGOS
Puede reproducirse libremente. Se agradecer citar la fuente.
THE RECORDING, COPYING, LOAN, UNAUTHORIZED HIRE, PUBLIC SHOWING OR
BROADCAST OF THIS DATAGRAM IS STRONGLY ENCOURAGED.
Claudio L. R. Sturla
Bibliografa:
Buffa, Elwood S. y Taubert, William H., Sistemas de Produccin e Inventario, Planeacin y
Control, Editorial Limusa, Mxico, 1.978.
Dorfman, R., Samuelson, P. A., y Solow, R. M., Programacin Lineal y Anlisis Econmico, Agui-
lar.
Dresdner, Mario O., Evelson, Abel R. y Dredner, Eduardo C., Tcnicas Cuantitativas Aplica das a
las Decisiones en la Economa de Empresas, Editorial El Coloquio, Buenos Aires.
Gass, Saul, Programacin Lineal ,Mtodos y Aplicaciones, CECSA, Mxico, 1.985, ISBN
968-26-0057-X.
Heims, Steve J., Von Newmann y N. Wiener, 2 tomos, Biblioteca Salvat de Grandes Biografas,
Salvat Editores, S. A., Barcelona, 1.986.
Mc Kinsey, J. C. C., Introduccin a la Teora Matemtica de los Juegos, Aguilar.
Shubik, Martin, Game Theory in the Social Sciencies, Concepts and Solution, The MIT Press,
Massachusetts, EE.UU., ISBN 0-262-69091-8. (Hay traduccin castellana bajo el ttulo de Teora de
los juegos en las Ciencias Sociales, Fondo de Cultura Econmica).
Problemas de decisin
Enfrentamiento con oponentes no racionales.
Enfrentamiento con oponentes racionales.

'

A su vez:
Enfrentamiento con oponentes no racionales
Certidumbre.
Riesgo.
Incertidumbre.

'

Certidumbre: Un nico futuro posible cuya probabilidad es


p 1
(Simplex).
Riesgo: Varios futuros posibles con probabilidades
p
j CONOCIDAS (Stocks).
Incertidumbre: Varios futuros posibles con probabilidades
p
j DESCONOCIDAS.
Enfrentamiento con oponentes racionales
Teora de
juegos.

'

juegos.doc 66
Prof. Ing. Claudio L. R. Sturla
Se denominan situaciones de CONFLICTO a aquellas en las cuales chocan los intereses de dos (o ms)
partes que persiguen objetivos distintos (y a veces opuestos).
Para hacer posible un anlisis del conflicto se construye su modelo matemtico.
Un ejemplo de situacin de conflicto es mostrada por [Buffa et al].
"Las alternativas que se le presentan a un ejecutivo que trata de adaptarse a las fluctuaciones de la
demanda son las siguiente: 1)ajustar el tamao de la fuerza de trabajo, contratando y despidiendo
personas, en respuesta a las fluctuaciones; 2) ajustar la tasa de produccin trabajando ms o menos
que el tiempo normal con la misma fuerza de trabajo; 3) absorber las fluctuaciones mediante las
fluctuaciones de los inventarios, del nmero de pedidos pendientes y mediante la prdida de algunas
ventas; 4) aumentar o disminuir la cantidad total de subcontrataciones, para absorber las
fluctuaciones de la demanda; 5) variar la asignacin de los recursos, en funcin del mercado, para
atenuar las fluctuaciones de la demanda; y 6) combinar las 5 estrategias puras."
Definiremos juego como el conjunto de reglas establecidas para resolver situaciones
de conflicto (incluye las reglas de terminacin)
El problema principal es: "Si n jugadores
P P P
n 1 2
, ,
juegan un juego , cmo debe jugar
el i-simo jugador para conseguir los resultados ms favorables?
Partida:
una realizacin posible particular de las reglas del juego.
Al final de cada partida de cada jugador
P
i
recibe un pago
v
i
llamado pago al jugador
P
i
. Cada
jugador tratar entonces de maximizar
v
i
. Por ejemplo en el pker el total de dinero ganado por los
ganadores es igual al total de dinero perdido por los perdedores. En ese caso tenemos
v v v
n 1 2
0 + + +
Si
v
i
0
ganancia.
Si
v
i
0
prdida.
Si
v
i
0
no hay pago.
Los juegos donde la suma algebraica de pagos es cero se llaman juegos de suma cero.
Ejemplo de juegos de suma no cero son el PRODE, la quiniela y en general todos los juegos organiza-
dos por el estado.
Hay juegos finitos: se los denomina as porque el nmero de movimientos es finito: por ejemplo el
ajedrez.
Un fabricante de jabn en panes quiere saber qu cantidad debe envasar para venderlo a 5 UM la pieza.
Su objetivo es hacer el pan de la cantidad suficiente de manera de competir favorablemente con los
dems fabricantes pero sin que resulte excesiva (para evitar prdidas). Y como hay infinitos pesos
posibles para el pan de jabn (o, al menos, un nmero tan grande que es conveniente considerarlo como
infinito) la situacin equivale a la de un juego en el que los jugadores hacen sus elecciones de entre un
conjunto infinito de alternativas.
De all que convenga extender nuestra nocin de juego de tal manera que incluya tambin a los jue gos
infinitos. Otro ejemplo de juego infinito es un duelo.
Un juego jugado por parejas como se estila en los juegos de naipes es un juego cooperativo. El ajedrez
es no cooperativo.
Nos interesamos en los juegos de dos personas, de suma cero y no cooperativos. Adems finitos.
Como ejemplo tomaremos el juego de los disparejos.
El primer jugador,
P
1
, elige ya sea "guila" o "sol" y el segundo jugador elige "guila" o "sol" sin co-
nocer la eleccin del jugador
P
2
. Despus de hacerse esto (es una partida) se comparan las elecciones.
juegos.doc 67
Prof. Ing. Claudio L. R. Sturla
Si
P
2
coincide con
P
1
paga una unidad a
P
1
. Si no coinciden le paga -1. -1 significa que
P
1
le paga una
unidad a
P
2
. Los pagos se estn expresando en trminos de
P
1
. En este caso
P
1
es el jugador
maximizante. El otro es el minimizante. Siempre usaremos esta convencin.
El enunciado puede resumirse en el siguiente diagrama:
Selecciones de
P
2
guila Sol
Selecciones de
P
1
guila 1 -1
Sol -1 1
El problema se puede resumir an ms por medio de la matriz:
1 1
1 1

_
,

P
1
selecciona filas y
P
2
columnas. La interseccin de la fila y la columna seleccionadas da el valor de lo
pagado a
P
1
.
Supongamos que yo soy
P
1
y juego con frecuencia 0,5 a cada fila. Mi probabilidad de ganar (esperanza
matemtica de la ganancia), si
P
2
juega a guila es:
( ) 1
1
2
1
1
2
0 +
Si
P
2
selecciona Sol es:
( ) + 1
1
2
1
1
2
0
Se llega al mismo resultado cualquiera sea la eleccin de
P
2
.
De este modo (frecuencias de 0,5 a cada fila)
P
1
se asegura de no exponerse a perder, CUALQUIERA
sea la eleccin de
P
2
.
Esta es la NICA forma que tiene
P
1
de jugar sin correr el riesgo de perder si
P
2
descubre lo que va a
hacer.
Si
P
1
juega a guila con probabilidad x y Sol con probabilidad (1-x), si
P
2
juega guila, la esperanza
matemtica de la ganancia estar dada por:
( ) ( ) ( ) E x x y x x x x x
1 2 1
1 1 1 1 2 1 , , + +
Si
P
1
juega a guila con probabilidad x y Sol con probabilidad (1-x), si
P
2
juega Sol, la esperanza
matemtica de la ganancia de
P
1
est dada por:
( ) ( ) ( ) E x x y x x x x x
1 2 2
1 1 1 1 1 2 , , + +
Si x
1
2
por ejemplo 0,7
( ) ( ) E x x y E x x y
1 2 1 1 2 2
2 0 7 1 0 4 1 2 0 7 0 4 , , , ; , , , ,
,

Si x
1
2
, por ejemplo 0, 2
juegos.doc 68
Prof. Ing. Claudio L. R. Sturla
( ) ( ) E x x y x E x x y x
1 2 1 1 2 2
2 1 2 0 2 1 0 6 1 2 1 2 0 2 0 6 , , , ; , , , ,
,

Por lo tanto, si
P
1
no quiere exponerse a prdidas debe jugar con una frecuencia relativa de 0,5 a cada
una de las filas. Lo mismo debe hacer
P
2
.
Intuitivamente se ve que hay una eleccin de selecciones mejor que las otras.
Veamos otro ejemplo. Considrese la siguiente matriz de pago:
1 3
4 2

_
,

La esperanza matemtica de la ganancia de


P
1
es:
( ) ( ) ( ) ( ) ( )
( )
E x y x y x y x y x y
x y x x y y x y y x x y
, + + +
+ + + +
1 3 1 4 1 2 1 1
3 3 4 4 2 1
+ + + +
+ + +

_
,

_
,

+
x y x x y y x y y x x y
x y x y x y
3 3 4 4 2 2 2 2
4 2 2 4
1
2
1
4
5
2
Si yo soy
P
1
y me conformo con ganar 5/2 me basta con jugar con x
1
2
(en los grandes nmeros
ganar 5/2). Anlogamente, si
P
2
se resigna a perder 5/2 debe jugar con y
1
4
.
Despus lo veremos formalmente pero nuevamente se ve que hay una seleccin mejor que otras (si uno
es prudente).
Consideremos el siguiente juego dado por la matriz de pago:
1 5 0 4
2 1 3 3
4 2 1 0

_
,

Para el jugador
P
1
se presentan tres opciones. Sera importante que uno buscara primero lo peor que le
puede pasar por fila. Entonces:
mn a a
mn a a
mn a a
j
j
j
j
j
j
1 13
2 22
3 33
0
1
1



Como
P
1
puede elegir cualquier i, tambin puede elegir el
mxmn a a
i j
ij

22
1
juegos.doc 69
Prof. Ing. Claudio L. R. Sturla
Las elecciones de
P
2
son por columna, entonces:
mx a a
mx a a
mx a a
i
i
i
i
i
i
1 31
2 12
3 23
4
5
3



mx a a
i
i4 14
4
Y nada me impide elegir:
min max a
j i
ij
3
Si se diera que
mxmn a mn mx a v
i j
ij
j i
ij

P
1
puede estar seguro de ganar como mnimo v y
P
2
puede impedir que
P
1
gane ms que v.
Pero.. cmo son estos jugadores?
Son inteligentes o sea si conociere cada jugador la estrategia que
el otro va a elegir, l seleccionar la estrategia que le
reportar el mayor beneficio.
Son prudentes o sea buscan obtener el resultado con la mayor se-
guridad posible. Obran con cuidado.
Si se cumpliera que:
mxmn a mn mxa v
i j
ij
j i
ij

P
1
jugar a la fila de v y
P
2
a la columna de v.
Cualquier desvo de esto significar una prdida para
P
1
o para
P
2
.
Definicin 1: Por estrategia mixta de
P
1
queremos indicar un vector fila
( ) x x x x
m

1 2
; ; ; de nmeros no negativos
x
i
tales que
x x x
m 1 2
1 + + +
Por estrategia mixta de
P
2
queremos significar un vector columna y
y
y
y
y
n

_
,

1
2
3

de nme-
ros no negativos
y
j tales que
y y y
n 1 2
1 + + +
juegos.doc 70
Prof. Ing. Claudio L. R. Sturla
x y
i j
e
representan respectivamente, las frecuencias con que
P
1
selecciona su
movimiento i-simo y
P
2
selecciona su movimiento j-simo.
Para el juego de los disparejos la estrategia mixta para
P
1
podra ser (0;1) (1;0) (1/4;3/4).
Definicin 2: Para cada
i m 1 2 3 , , , ,
la estrategia mixta que es uno en el i-simo
componente y cero en cualquier otro, recibe el nombre de i-sima estrategia pura
para el maximizante. Se la designa i.
La j-sima estrategia pura para el minimizante, designada por j es una estrategia mixta
para el minimizante, la cual es uno para el j-simo componente y cero para
cualquier otro.
Dijimos que si exista un valor
mxmn a mn mx a v
i j
ij
j i
ij

la solucin del juego es nica y
P
1
cobra v y
P
2
pierde v.
El juego que presenta esa propiedad se dice que tiene punto de ensilladura o punto de silla.
Por ejemplo:
3 5 6
1 2 3
0 7 2

_
,

mxmn a mn mxa a
i j
ij
j i
ij

11
3
a
11
es el mnimo en su fila y mximo en su columna. El jugador
P
1
no jugar a las filas 2 y 3.
P
2
no
jugar a las columnas 2 y 3. Las estrategias puras sern:
( ) x y

_
,

10 0
1
0
0
, , ;
Son estrategias puras ptimas.
Ejemplo N 1
Dada la matriz de pago de A a B, hallar la matriz de pago de B a A.
B A

_
,

_
,

1 2 1
3 2 2
1 3
2 2
1 2
;
Ejemplo N 2
Los siguientes juegos tienen solucin de punto minimax. Determinar las estrategias puras ptimas para
cada jugador.
juegos.doc 71
Prof. Ing. Claudio L. R. Sturla
( )
6 8 6
4 12 2
6
2
1 0
1
0
0
0
0
1
6 12 6

_
,

_
,

_
,

; , ; x y
( )

_
,

_
,

5 2 0 7
5 6 4 8
4 0 2 3
5
4
3
0 1 0
0
0
1
0
5 6 4 8
; ; x y
Si no hubiera punto de ensilladura con los conocimientos que tenemos no existe solucin. Slo un
circuito de elecciones posibles. En el caso de que no haya punto de minimax no hay equilibrio en el
juego.
Tomemos por ejemplo el siguiente juego que no tiene punto de ensilladura:
B
A
4 2 5
1 3 1

_
,

Si A juega 25 veces a la fila 1 y 75 veces a la fila 2, la ganancia media de A si B elige la columna 1 ser:
( )
( ) V
B 0 25
1
0 25 4 1 0 75 0 25
, ;
, , , +
Si B eligiera la columna 2:
( )
( ) V
B 0 25
2
0 25 2 3 0 75 1 75
, ;
, , , +
Si B eligiera la columna 3:
( )
V
B 0 25
3
5 0 25 1 0 75 2
, ;
, , +
B ignora las estrategias de A.
Teorema de VON NEWMANN
Llamaremos ( ) E x
a la esperanza matemtica de la ganancia de
P
1
. Tambin llamada funcin de pago.
El teorema dice:
"Existe para el maximizante una estrategia mixta ptima ( )
x x
1 2
* *
,
para la cual su
ganancia media ( )
E x x
1 2
* *
,
ser superior o igual a una cantidad v llamada valor del
juego y existe para el minimizante una estrategia mixta ptima ( )
y y y
1 2 3
* * *
, ,
para la
cual su prdida media ( )
E y y y
1 2 3
* * *
, ,
ser inferior o igual al valor del juego v."
Definicin 3: La funcin de pago para
P
1
, o sea la esperanza matemtica de
P
1
se
define por
juegos.doc 72
Prof. Ing. Claudio L. R. Sturla
( ) ( ) E x y x A y x a y
i ij j
j
n
i
m
,


1 1
donde x e
y
son estrategias mixtas cualesquiera de
P
1
y
P
2
respectivamente.
( ) ( )
( ) ( ) ( )
E x y x x
y
y
y
x x y x x y x x y
,

_
,

_
,


+ + + +
1 2
1
2
3
1 2 1 1 2 2 1 2 3
4 2 5
1 3 1
4 2 3 5
Definicin 4: Una solucin a un juego matricial son dos estrategias mixtas ptimas
( )
x x x x
y
y
y
y
m
n
* * * *
*
*
*
*
, , ,

_
,

1 2
1
2

y un nmero v tal que


( )
( )
E x j v j n
E i y v i m
*
*
, , , ,
, , , ,


para las estrategias puras
para las estrategias puras
1 2
1 2

Las
x
*
e y
*
se llaman estrategias mixtas ptimas.
v puede ser negativa, positiva o cero.
En el juego de los disparejos cuya matriz era
1 1
1 1

_
,

el valor del juego es cero y las estrategias ptimas son x y


* *
, ;
/
/

_
,

_
,

1
2
1
2
1 2
1 2
. Sin demostrarlo
aceptamos como axioma que un juego con v = 0 es justo.
Todo nos permite decir ahora que
( ) ( ) ( )
E x y E x y E x y , , ,
* * * *

(a)
expresin escrita para el maximizante.
juegos.doc 73
Prof. Ing. Claudio L. R. Sturla
La expresin (a) es equivalente a:
( ) ( ) m xmn E x y mnm xE x y v
x y y x
, ,
(a) recibe el nombre de punto de ensilladura de los juegos matriciales.
Definicin 5: Un juego simtrico tiene una matriz de pago oblicua simtrica, esto
es
a a a
ij ji ij
; 0
si
i j
.
Se puede demostrar que el valor del juego es cero y que ambos jugadores tienen es-
trategias ptimas simtricas.
Ejemplo N 3
Dos jugadores hablan simultneamente diciendo o piedra o papel o tijeras. La combinacin de papel y
piedra gana una unidad para el jugador que dijo papel (el papel envuelve a la piedra); para piedra y
tijeras gana la piedra (la piedra rompe las tijeras) y para tijeras y papel ganan las tijeras (cortan al papel).
Si los dos jugadores mencionan lo mismo no hay pago.
Plantear la matriz de pago y dar el valor del juego.
La matriz de pago si
P
1
es el jugador maximizante es:
Piedra Papel Tijeras
Piedra
Papel
Tijeras
0 1 1
1 0 1
1 1 0

_
,

Por la definicin 5 el valor del juego es cero pues la matriz es oblicua simtrica.
Propiedad: Para una nueva matriz de pago donde el valor de los elementos es
a w
ij
+
y
w
es un nmero positivo, las estrategias ptimas son las mismas que
para el juego original y el valor del nuevo juego es
v w +
.
Teorema fundamental de los juegos matriciales
Para todo juego matricial existen
( ) ( ) m xmn E x y mnm xE x y
x y y x
, , y
y son iguales. Esto es, todo juego matricial tiene una solucin.
Ejemplo N 4
Un jugador extiende alguno o algunos de sus dedos y al mismo tiempo supone (dicindolo) cuntos
dedos extiende el otro. El nmero de dedos que se puede extender es 1, 2 3.
Si uno solo de los jugadores adivina, su pago es el total del nmero de dedos extendidos. De lo con-
trario su pago es cero.
Equivalencia del juego matricial y el problema de programacin lineal
Supondremos que se nos da un juego matricial arbitrario:
juegos.doc 74
Prof. Ing. Claudio L. R. Sturla
a a a
a a a
a a a
n
n
m m mn
11 12 1
21 22 2
1 2

_
,

Por definiciones 3 y 4 el problema es encontrar para


P
1
un vector ( ) x x x x
m

1 2
, , , y un nmero v
tales que:

'

+ + +
+ + +
+ + +
v x a x a x a
v x a x a x a
v x a x a x a
m mn n n
m m
m m

2 2 1 1
2 2 22 1 12
1 2 21 1 11
x x x x
m i i 1 2
1 0 + + + ;
En forma similar para
P
2
:
a y a y a y v
a y a y a y v
a y a y a y v
n n
n n
m m mn n
11 1 12 2 1
21 1 22 2 2
1 1 2 2
+ + +
+ + +
+ + +

'

y y y y
n j i 1 2
1 0 + + + ;
Como cada elemento de (A) puede hacerse positivo mediante la suma de una constante apropiada a
todas las
a
ij podemos suponer que
v 0.
Si hacemos
x
x
v
y
y
v
i
j
j
1

;
x
v
x
v
y
v
y
v
i
m
i
i
m
j
j
n
j
j
n
1
1 1
1 1
1 1
1 1






Al minimizar
x P
i
i
m

1
1
,
maximizar el valor del juego v y al maximizar
y P
j
j
n

1
2
,
minimizar el valor
del juego.
Entonces podemos redefinir el problema de programacin lineal de la siguiente manera:
Primal:
Encuentre un vector
juegos.doc 75
Prof. Ing. Claudio L. R. Sturla
( )
x x x x
m

1 2
, , ,
tal que minimice
x x x
m 1 2

+ + +
sujeto a:
a x a x a x
a x a x a x
a x a x a x
m m
m m
n n mn m
11 1 21 2 1
12 1 22 2 2
1 1 2 2
1
1
1



+ + +
+ + +
+ + +

'

x
i
i

0
El problema dual:
Encuentre un vector
y
y
y
y
y

_
,

1
2
3
4
tal que maximice
y y y
n 1 2

+ + +
sujeto a
a y a y a y
a y a y a y
a y a y a y
n n
n n
m m mn n
11 1 12 2 1
12 1 22 2 2
1 1 2 2
1
1
1



+ + +
+ + +
+ + +

'

y
j
j

0
Puesto que el juego tiene solucin, existen soluciones ptimas a los problemas anteriores y
mn x mx y
v
i j
j
n
i
m




1 1
1
Ejemplo N 5
Dada la matriz de pago
juegos.doc 76
Prof. Ing. Claudio L. R. Sturla
6 0 3 8
8 2 3 9
4 6 5 7

_
,

Determinar, aplicando programacin lineal, las estrategias ptimas para los dos jugadores.
6 8 4
2 6
3 3 5
8 9 7
1 2 3
2 3
1 2 3
1 2 3
x x x v
x x v
x x x v
x x x v
+ +
+
+ +
+ +

'

x x x x
i i 1 2 3
1 0 + + ;
El dual ser:
6 3 8
8 2 3 9
4 6 5 7
1 3 4
1 2 3 4
1 2 3 4
y y y v
y y y y v
y y y y v
+ + +
+ +
+ + +

'

y y y y y
j i 1 2 3 4
1 0 + + + ;
Si dividimos miembro a miembro por v:
6 3 8 1
8 2 3 9 1
4 6 5 7 1
1 3 4
1 2 3 4
1 2 3 4
y y y
y y y y
y y y y



+ + +
+ +
+ + +

'

y y y y
v
mx
1 2 3 4
1

+ + +
Sumamos un nmero w 2 a la matriz original.
8 2 5 10
10 0 5 11
6 8 7 9

_
,

El dual ser:
8 2 5 10 1
10 5 11 1
6 8 7 9 1
1 2 3 4
1 3 4
1 2 3 4
y y y y
y y y
y y y y



+ + +
+ +
+ + +

'

y y y y
v
max
1 2 3 4
1

+ + +
*
juegos.doc 77
Prof. Ing. Claudio L. R. Sturla
Si agregamos las variables de holgura:

'

+ + + +
+ + +
+ + + +



1 9 7 8 6
1 11 5 10
1 10 5 2 8
3 4 3 2 1
2 4 3 1
1 4 3 2 1

y y y y
y y y
y y y y
La resolucin por programacin lineal es:
1 1 1 1 0 0 0
c
k
Base
P
0
P
1
P
2
P
3
P
4
P
5
P
6
P
7

0
P
5
1 8 2 5 10 1 0 0 1/5
0
P
6
1 10 0 5 11 0 1 0 1/5
0
P
7
1 6 8 7 9 0 0 1 1/7
0 -1 -1 -1 -1 0 0 0
0
P
5
2/7 26/7 -26/7 0 25/7 1 0 -5/7 2/26
0
P
6
2/7 40/7 -40/7 0 32/7 0 1 -5/7 2/40
1
P
3
1/7 6/7 8/7 1 9/7 0 0 1/7 1/6
1/7 -1/7 1/7 0 2/7 0 0 1/7
0
P
5
1/10 0 0 0 6/10 1 -13/20 -1/4
1
P
1
1/20 1 -1 0 16/20 0 7/40 -1/8
1
P
3
1/10 0 2 1 6/10 0 -3/20 1/4
3/20 0 0 0 8/20 0 1/40 1/8

1
D

2
D

3
D

4
D
x
1

x
2

x
3

y y
y y
v
v
1 3
1 3
1
20
1
10
1 3
20
20
3



+
;
*
*
y
y
v
y y v
y
y
v
y y v
1
1
1
1
3
3
3
3
1
20
20
3
1
3
1
10
20
3
2
3




*
*
*
*
y y
x x x
1 3
1 2 3
1
3
2
3
1
0
1
40
1
8
+ +


; ;
juegos.doc 78
Prof. Ing. Claudio L. R. Sturla
x x
x x x
2 3
1 2 3
1
40
20
3
1
6
1
8
20
3
20
24
5
6
0
1
6
5
6
1

+ + + +
;
v v v
v v
* *
*
; +

20
3
2
2
20
3
2
14
3
Aqu, si sobrare tiempo, se puede intercalar la resolucin por
programacin lineal de papel, piedra y tijeras.
Principio de dominancia
Sea el juego definido por la siguiente matriz:
2 4 1 0
3 1 4 2

_
,

El valor del juego para A si juega a la primera fila con probabilidad


p
1
y si B juega a la primera columna
es:
( ) ( ) V p B p p p p p
A 1 1 1 1 1 1 1
2 3 1 2 3 3 3 , + +
El valor calculado es la esperanza matemtica de la ganancia para el jugador A si A juega a la primer fila
con probabilidad
p
1
y el jugador B juega a la primer columna.
Si B juega con estrategia
B
1
y A juega a la primera fila pierde 2 y si juega a la segunda pierde 3.
Si B jugara a la cuarta columna y A a la primera fila, B pierde 0.
Si A jugara a la segunda fila, B perdera 2.
Siempre convendr a B jugar en la cuarta columna. B nunca jugar a la primera. Se dice que la primera
columna es dominada. Entonces el juego se transforma es una matriz como:
4 1 0
1 4 2

_
,

De la misma manera, toda fila dominada por otra puede ser suprimida en la matriz de un juego.
Es importante porque permite reducir algunos juegos al tamao 2 x 2 que se resuelven fcilmente en
forma grfica.
Ejemplo N 6
Reducir el siguiente juego aplicando dominancias:
3 0 2
4 5 1
4 3 3

_
,

juegos.doc 79
Prof. Ing. Claudio L. R. Sturla
La columna uno tiene valores superiores respecto a la tercera. Entonces se elimina la primera que es
dominada
0 2
5 1
3 3

_
,

Ahora todos los elementos de la primera fila son menores a los de la tercera. La tercera domina a la
primera. Se anula la primera.
5 1
3 3

_
,

Ejemplo N 7
Reducir el siguiente juego aplicando dominancias:

,
_

3 8 2
4 5 3
16 10 3
Resolucin analtica y grfica de juegos.
Supongamos que se nos presenta el siguiente juego:
B
y
1
y
2
x
1
4 8
Jugador A
x
2
6 2
que no tiene punto de ensilladura. El jugador seleccionara por minimax la peor situacin de cada al-
ternativa (4 para
x
1
y 2 para
x
2
) para luego optar por la que asegura la mayor de dichas ganancias
mnimas. El valor del juego para A es:
V
A
4
que es la retribucin mnima que espera ganar jugando su estrategia
x
1
.
De la misma manera el valor del juego para el jugador B es
V
B
6
pero esto es un crculo vicioso. Por ello deberan recurrir a estrategias mixtas. Supongamos que A juega
a sus alternativas ( ) x x p p
1 2 1 1
1 y con probabilidades y . Su ganancia no depende de lo que l juega
sino de la estrategia seguida por B.
Por ejemplo si B juega su estrategia
y
1
, la ganancia de A ser:
( ) ( ) V p y p p p p p
A 1 1 1 1 1 1 1
4 6 1 4 6 6 6 2 , + +
Expresin que da la esperanza matemtica de la ganancia del jugador A si l juega a la primer fila
con frecuencia relativa
x
1
y el jugador B juega a la primera columna.
Si B jugara a la estrategia
y
2
:
juegos.doc 80
Prof. Ing. Claudio L. R. Sturla
( ) ( ) V p y p p p p p
A 1 2 1 1 1 1 1
8 2 1 8 2 2 2 6 , + + +
A tratar de hacer mxima la ganancia independientemente de la estrategia de B. Eso significa:
( ) ( ) V p y V p y
p p
p p p
A A 1 1 1 2
1 1
1 1 1
6 2 2 6
6 2 6 2 8
, ,
+
+
4 8
0 5
1
1

p
p ,
Haciendo el mismo razonamiento para B.
( ) ( )
( ) ( )
V q x q q q q q
V q x q q q q q
B
B
1 1 1 1 1 1 1
1 2 1 1 1 1 1
4 8 1 4 8 8 8 4
6 2 1 6 2 2 2 4
,
,
+ +
+ + +
8 4 2 4
8 2 8
1 1
1
+

q q
q
6 8
6
8
0 75
1
1


q
q ,
Hasta aqu ha sido una mera resolucin con geometra analtica elemental.
Ahora veamos como se puede resolver grficamente.
La figura muestra la variacin de la ganancia esperada por el jugador A para diversos valores de
p
1

cuando su adversario juega sus estrategias
y y
1 2
e .
( )
( )
V p y
V p y
A
A
1 1
1 2
0 5 4 0 5 6 0 5 5
0 5 8 0 5 2 0 5 5
+
+
, ; , ,
, ; , ,
juegos.doc 81
Prof. Ing. Claudio L. R. Sturla
2
4
6
0,3
V
A
p
1
M
N
Q
p
1
*
2+6 p
1
6-2 p
1
Supongamos que A carga su bolillero con p
1
*
bolillas blancas. En ese caso su beneficio oscilara entre
SN y SM de acuerdo a las estrategias que adopte el jugador B. Con criterio conservador A esperara
ganar SN. Es decir, SN sera el
( )
V p
A 1
*
Para otros valores de
p
1
entre 0 y 1 el valor esperado ser la quebrada PQR. Como A pretende ma-
ximizar su ganancia mnima, es obvio que eligir el valor
p
1
0 5 ,
con lo que se asegura un valor es-
perado de la ganancia de
( ) V p
A 1
5
El punto Q es el mayor. Por un razonamiento anlogo en la figura se ve que la estrategia ptima para B
es con
q
1
0 75 ,
( ) V q
B 1
5
juegos.doc 82
Prof. Ing. Claudio L. R. Sturla
2
4
6
0,3
V
1
B
q
8-4 q
1
2+4 q
1
0,75
Este mtodo de resolucin grfica de juegos puede utilizarse tambin para aquellos juegos cuya matriz
consta de 2 filas y ms de 2 columnas o de 2 columnas y ms de 2 filas.
Sea por ejemplo el siguiente juego:
2 4 1 0
3 1 4 2

_
,

p p p p
1 2 2 1
1 1 + ;
Analticamente puede hallarse:
( ) ( )
( ) ( )
( ) ( )
V p y p p p p p
V p y p p p p p
V p y p p p p p
A
A
A
1 1 1 1 1 1 1
1 2 1 1 1 1 1
1 3 1 1 1 1 1
2 3 1 2 3 3 3
4 1 4 1 1 3
4 1 4 4 4 5
,
,
,
+ +
+ + +
+ +
( ) ( ) V p y p p
A 1 4 1 1
2 1 2 2 ,
La figura muestra como varan las ganancias esperadas al variar
p
1
entre 0 y 1.
juegos.doc 83
Prof. Ing. Claudio L. R. Sturla
2
4
6
V
A
p
1
1+3p
1
4-5p
1
3-p
1
2-2p
1
Analizando la figura se ve claramente que el jugador B no est interesado en las estrategias
y y
1 3
e
pues
le aseguran una prdida mayor que la ganancia esperada por A. Entonces
q q
1 3
0 .
Slo resta hallar
los valores de
q q
2 4
y .
La columna 1 es dominada por la 4.
En cambio la columna 3 no es dominada estrictamente.
Una dominancia estricta significa que las relaciones entre elementos de filas o columnas se expresan
mediante los signos
y no .
q q q q
2 4 4 2
1 1 + ;
( ) ( )
( ) ( )
V q x q q q
V q x q q q q q
B
B
2 1 2 2 2
2 2 2 2 2 2 2
4 0 1 4
2 1 2 2 2
,
,
+
+ +
juegos.doc 84
Prof. Ing. Claudio L. R. Sturla
2
4
6
V
B
q
4q
2
2-2q
1
2
1,6
0,4
Ejemplo N 8
Resolver grficamente el juego asociado con la siguiente matriz de pago:
1 3 11
8 5 2

_
,

( ) ( )
( ) ( )
( ) ( )
V p y p p p p p
V p y p p p p p
V p y p p p p p
A
A
A
1 1 1 1 1 1 1
1 2 1 1 1 1 1
1 3 1 1 1 1 1
8 1 8 8 8 7
3 5 1 3 5 5 5 2
11 2 1 11 2 2 2 9
,
,
,
+ +
+ +
+ + +
2
4
6
V
A
p
1
2+9p
1
8-7p
1
4,5
0,27
5-2p
1
juegos.doc 85
Prof. Ing. Claudio L. R. Sturla
5 2 2 9
3 11
3
11
0 27
1 1
1
1
+


p p
p
p ,
V p
A
5 2 5 2
3
11
5
5
11
49
11
4 45
1
,
y p p V
A 1 1 2
0 0 27 0 73 4 45 ; , ; , ; ,
Planteamos para B.
( ) ( )
( ) ( )
V q x q q q q q
V q x q q q q q
B
B
2 1 2 2 2 2 2
2 2 2 2 2 2 2
3 11 1 3 11 11 11 8
5 2 1 5 2 2 2 3
,
,
+ +
+ + +
2
4
6
V
B
q
2
2+3q
2
11-8q
2
4,5
0,81
11 8 2 3
9 11
9
11
2 2
2
2
+

q q
q
q
11 8 11 8
9
11
121 72
11
49
11
4 5
2


q ,
Ejemplo N 9
Un supermercado desea implantar un sistema de vigilancia para su sector ventas. A tal efecto se han
considerado dos zonas (A y B) en el edificio, el cual consta de una sola planta. La primera, donde se
juegos.doc 86
Prof. Ing. Claudio L. R. Sturla
exhiben la mayora de los artculos, es frecuentada por una gran cantidad de clientes, mientras que la
segunda no es tan concurrida.
Se han instalado dos cmaras de T.V. que permiten observar las zonas A y B desde el local T donde
estn ubicados los monitores.
De esta forma, los policas pueden situarse en A, en B o en T mientras que los ladrones pueden pre-
sentarse en A o en B.
Los policas han hecho una estimacin de las probabilidades de descubrir y capturar al ladrn. Una de las
hiptesis es suponer que es muy raro que varios ladrones acten al mismo tiempo en el supermercado.
Segn la experiencia se estima que si el ladrn se encuentra en A y el polica en T, la probabilidad de
captura es 0,3. Para el resto de posibilidades se obtiene la siguiente tabla:
El ladrn
A B
T 0,3 0,5
Polica A 0,4 0,2
B 0,1 0,7
Se pide:
1. Construir la matriz de pago.
2. Definir las estrategias ptimas de los policas.
Los dos policas se pueden encontrar juntos o separados en A, B T. Las probabilidades de captura
sern entonces para los casos TT (ambos en T); AA (los dos en A); TA (uno en T y otro en A), etc. La
captura del ladrn por el primer polica ser representada por la variable aleatoria
x
1
que puede tomar
valor 1 (capturado) 0 (ladrn no capturado). La captura del ladrn por parte del segundo polica ser
x
2
. Y se acepta la hiptesis de que
x x
1 2
e
son variables independientes,
( )
( )
p p p p
TA T A T
A ( )
, , , ,
y el ladrn en
+
+
1
0 3 0 4 1 0 3 0 58
p
TA
A ( ) y el ladrn en
probabilidad de captura por parte del primer polica + probabilidad de
captura por parte del segundo polica si el primero no lo ha capturado.

As se pueden calcular todas las posibilidades de posicin del ladrn con la disponibilidad conjunta de
los dos policas.
El ladrn
A B
TT 0,51 0,75
x
1
AA 0,64 0,36
x
2
Los dos BB 0,19 0,91
x
3
policas TA 0,58 0,6
x
4
TB 0,37 0,85
x
5
AB 0,46 0,76
x
6
y
1
y
2
Otro ejemplo.
juegos.doc 87
Prof. Ing. Claudio L. R. Sturla
( )
( ) ( ) p p p p
TT T T T
A y el ladron en
+ + 1 0 3 0 3 1 0 3 0 51 , , , ,
Las ecuaciones de los policas son:
0 51 0 64 0 19 0 58 0 37 0 46
0 75 0 36 0 91 0 60 0 85 0 76
1 2 3 4 5 6
1 2 3 4 5 6
, , , , , ,
, , , , , ,
x x x x x x v
x x x x x x v
+ + + + +
+ + + + +
x x x x x x x
i i 1 2 3 4 5 6
1 0 + + + + + ;
Y las del ladrn sern
0 51 0 75 1
0 64 0 36 2
0 19 0 91 3
1 2
1 2
1 2
, , ( )
, , ( )
, , ( )
y y v
y y v
y y v
+
+
+
0 58 0 6 4
0 37 0 85 5
0 46 0 76 6
1 2
1 2
1 2
, , ( )
, , ( )
, , ( )
y y v
y y v
y y v
+
+
+
y y y
j j 1 2
1 0 + ;
Resolvemos por el mtodo grfico.
1
y
v
0,6
0,4
0,2
(1)
(2)
(3)
(4)
(5)
(6)
0,63
0,58
juegos.doc 88
Prof. Ing. Claudio L. R. Sturla
y y v
1 2
0 58 0 42 0 63 , ; , ; ,
No intervienen las inecuaciones (2), (3), (5) y (6). Por lo tanto
6 5 3 2
y , , x x x x
son nulas. Las ine-
cuaciones de los policas se reducen a:
v x x
v x x
+
+
4 1
4 1
6 , 0 75 , 0
58 , 0 51 , 0
i i
x x x + 0 ; 1
3 1
que se puede resolver fcilmente usando el mtodo grfico.
Juegos contra la naturaleza.
Es un problema de decisin que aparece cuando conociendo varios futuros posibles no se pueden de-
terminar las probabilidades de cada uno de esos futuros. Por ejemplo la demanda que tendr un pro-
ducto de acuerdo a su precio.
Ejemplo N 10
(Donde es razonable usar el criterio minimax)
Supongamos que quiero invertir 10.000 UM para un perodo donde no sabemos si habr paz, guerra fra
o la guerra. Se puede elegir entre:
Bonos del tesoro;
Acciones de empresas que producen armas;
Acciones de empresas comerciales.
Las tasas de rendimiento anual son:
Guerra Guerra fra Paz
Bonos del Tesoro
Valores en armamentos
Acciones comerciales
2 3 3 2
18 6 2
2 7 12
,

_
,

'

La lnea 3 domina (en forma no estricta) a la lnea 1. Esto transforma la matriz de pago:
18 6 2
2 7 12

_
,

Las inecuaciones que rigen el juego son: (si y slo si la naturaleza fuese racional, pero no se com-
porta como tal desde nuestro punto de vista).
18 2
6 7
2 12
2 3
2 3
2 3
x x v
x x v
x x v
+
+
+
x x
2 3
1 +
Aplicando el mtodo grfico se encuentra:
juegos.doc 89
Prof. Ing. Claudio L. R. Sturla
x x v
2 3
5
17
12
17
6 7 ; ; ,
Si hay guerra la ganancia ser:
18
5
17
2
12
17
6 7 + ,
Si hay guerra fra:
6
5
17
7
12
17
6 7 + ,
Si hay paz:
( ) + 2
5
17
12
12
17
7 88 ,
Colocando 10 000
5
17
2 941 . . UM UM en armamento y 10 000
12
17
7 059 . . UM UM en acciones
comerciales, el financista se asegura por lo menos una ganancia de 670 UM.
Ejemplo con informacin parcial.
Ejemplo N11
Para calentar una casa se necesitan 4 t de carbn si el invierno es suave, 5 t si es normal y 6 t si es ri-
guroso. El carbn se compra en verano. En verano se paga 200 UM/t. Si el invierno es suave la t cuesta
200 UM, si es normal 220 UM y 240 UM si es muy fro. Qu decisin tomar?
Si se compran 4 t en verano se deber gastar:
800 UM si el invierno es suave;
800 UM + 220 UM = 1.020 UM si es normal y
800 UM +2 x 240 UM = 1.280 UM si es riguroso.
Cuando se adquieran 6 t en verano se debern desembolsar 1.200 UM cualquiera sea la temperatura del
invierno.
Suave Normal Riguroso
-800 -1.020 -1.280
-1.000 -1.000 -1.240
-1.200 -1.200 -1.200

_
,

'

1280 4
1240 5
1200 6
.
.
.
t
t
t
Si ahora la oficina meteorolgica afirma que el invierno no ser riguroso. Cul ser la estrategia p-
tima?. Se suprimen las filas y columnas terceras.
Suave Normal

_
,

'

800 1020
1000 1000
1020 4
1000 5
.
. .
.
.
t
t
v 1 000 .
juegos.doc 90
Prof. Ing. Claudio L. R. Sturla
Se puede enunciar la siguiente propiedad:
Toda informacin parcial o total sobre el estado de la naturaleza no podr jams
disminuir el valor del juego si se est maximizando."
Ejemplo donde el criterio minimax resulta inaceptable.
Ejemplo N 12
Un vendedor de diarios vende una revista quincenal. Los martes recibe un cierto nmero de ejemplares y
devuelve los sobrantes el martes siguiente. Cada vez que vende una revista gana 0,5 UM y si devuelve
pierde 0,3 UM por revista. La nica informacin de que dispone es que nunca se venden ms de 50
ejemplares.
Supondremos que vara su compra de a 10 ejemplares. Hacemos la siguiente tabla:
0 10 20 30 40 50
0 0 0 0 0 0
3 5 5 5 5 5
6 2 10 10 10 10
9 1 7 15 15 15
12 4 4 12 20 20
15 7 1 9 17 25
0 0
10 3
20 6
30 9
40 12
50 15

_
,

'

ej UM
ej UM
ej UM
ej UM
ej UM
ej UM
.
.
.
.
.
.
Lo prudente es que no venda. Pero de eso vive. El vendedor tratar de obtener datos sobre la demanda.
Los juegos contra la naturaleza son juegos donde si bien se conocen los varios futuros posibles no se
conoce su distribucin de probabilidades.
Habr que recurrir a algn criterio para aplicar en cada problema de decisin.
Criterio de LAPLACE
Trabaja con incertidumbre. Dado que no se conocen las probabilidades de los estados futuros, se
considera a stos equiprobables.
Si hay n futuros posibles supondremos que las probabilidades de cada uno de ellos es
1
n
. Adoptaremos
el mayor valor esperado.
Para cada estrategia las esperanzas son:
E a
n
i ij
j


1
y luego se elige
mx E
i
i
Ejemplo N 13
Una empresa debe optar entre dos mquinas (A y B) para procesar una pieza. Para una de ellas (la A) el
costo de preparacin es de 2.000 UM y el costo unitario de produccin 20 UM. La otra (la B) tiene
costos de 5.000 y 10 UM respectivamente. Qu mquina es la ms conveniente si el precio de venta es
de 30 UM/u y la produccin requerida est dentro del rango
100 400 Q u
?
La ganancia bruta que se obtiene con A B es:
juegos.doc 91
Prof. Ing. Claudio L. R. Sturla
( )
( )
G A Q Q Q Q Q
G B Q Q Q Q Q
A
A
( ) . . .
( ) . . .
+
+
30 2 000 20 30 2 000 20 10 2 000
30 5000 10 30 5000 10 20 5000
Si consideramos como nicos niveles posibles los niveles de demanda
F u F u
1 2
100 250 ; ;
F u
3
400 .
F F F
A m quinaA
A m quinaB
1 2 3
1
2
1000 500 2 000
3000 0 3000

_
,


'

. .
. .
( )
( )
Aplicando LAPLACE asignamos a cada futuro la probabilidad
p 0 33 , .
El valor esperado de la ga-
nancia es:
( )
( )
VE A
VE A
1
2
1000 0 33 500 0 33 2 000 0 33 500
3000 0 33 3000 0 33 0
+ +
+
. , , . ,
. , . ,
Podra objetarse el conjunto de futuros que se han enunciado. Este es el inconveniente de LAPLACE.
La decisin puede ser condicionada por la forma en que se plantean los futuros posibles. Veamos el
mismo ejemplo con ms posibilidades de demanda:
100 150 200 250 300 350 400
1000 500 0 500 1000 1500 2 000
3000 2 000 1000 0 1000 2 000 3000
1
2

_
,


'

. . . .
. . . . . .
A
A
( ) VE A
1
1000
1
7
500
1
7
500
1
7
1000
1
7
1500
1
7
2 000
1
7
500 + + + + . . . .
( ) VE A
2
3000
1
7
2 000
1
7
1000
1
7
1000
1
7
2 000
1
7
3000
1
7
0 + + + . . . . . .
Se elige la alternativa 1.
Criterio de WALD
Es un criterio de pesimismo. La persona que decide se pone en la posicin de mayor pesimismo. En el
ejemplo visto se preguntara: qu es lo peor que me puede pasar?
Peor compensacin
A
1
-1.000
A
2
-3.000
y ahora se elige el ms favorable de los peores ( ) A
1
. Es el criterio en que se bas VON NEWMANN.
Criterio de HURWICZ
Supongamos que tenemos la siguiente matriz de pago:
9 2
3 7

_
,

juegos.doc 92
Prof. Ing. Claudio L. R. Sturla
Se selecciona el MAX (lo mejor) y el MIN (lo peor) de cada estrategia.
MAX MIN
primera fila 9 2
segunda fila 7 3
Se elige un coeficiente
0 1
de optimismo y se multiplica a los MAX por y los MIN por el
pesimismo ( ) 1
( )
( )
H
H
1
2
9 2 1 2 7
7 3 1 3 4
+ +
+ +


2
4
6

i
H
1
H
2
1 / 3
Si la posicin del jugador es pesimista
0
1
3

_
,

elige la estrategia 2 que le asegura menos prdida.


Si la posicin es optimista
1
3
1

_
,

elige la estrategia 1 donde arriesga ms de


1
3
de su capital pero
tiene esperanzas ms altas.
Ejemplo N 14
Naturaleza
1 2 UM 5 UM
Jugador
2 -4 UM 1.000 UM
Si
1
100
H
1
99
100
2
1
100
5 2 03 + ,
juegos.doc 93
Prof. Ing. Claudio L. R. Sturla
( ) H
2
99
100
4
1
100
1000 5 94 + ,
Se puede calcular el coeficiente de optimismo para el cual la lnea 2 sea preferida sobre la 1.
( ) ( ) ( ) 1 2 5 4 1 1000
2 2 5 4 4 1000
2 3 4 1004
+ +
+ + +
+ +



.
.
.
6 1 001
6
1 001
0 006 .
.
,
Recordemos que el caso de minimax corresponde a 0.
Criterio de SAVAGE
En el problema de las mquinas que vimos la tabla era:
F
1
F
2
F
3
Mquina A -1.000 500 2.000
Mquina B -3.000 0 3.000
Si realmente ocurriera
F
3
, quien hubiera elegido la mquina A se lamentar por las
3 000 2 000 1 000 . . . UM UM UM
.
Si hubiera elegido la mquina B no habra ninguna afliccin (3.000 - 3.000 = 0 UM).
Entonces SAVAGE considera el caso de las personas que se enfrentan con un problema de decisiones y
al elegir una de las alternativas tienden a lamentarse por no haber elegido la alternativa ptima.
El grado de satisfaccin est dado por "la diferencia existente entre la compensacin que realmente
recibi y la que debiera correspondido si hubiera sabido con antelacin el estado natural que habra de
producirse".
Con el razonamiento para hallar los lamentos podra confeccionarse la matriz de lamentos que en
nuestro caso es:
F
1
F
2
F
3
Mquina A 0 0 1.000
Mquina B 2.000 500 0
Estos son pesares. De ellos queremos, por supuesto, el menor. En nuestro problema tendremos:
Afliccin
Mquina A 1.000
Mquina B 2.000
La eleccin recae en A.
Ejemplo N 15
juegos.doc 94
Prof. Ing. Claudio L. R. Sturla
Una empresa desea lanzar un producto al mercado y est estudiando la posibilidad de venderlo a 8, 10,
12, 14, 16, 18 20 UM/u. El beneficio de la empresa variar tal como indica la siguiente matriz de
ganancia (en millones de UM).
Precios de la competencia
F
1
F
2
F
3
F
4
F
5
( ) A UM u
1
8 /
-30 10 15 20 20
( ) A UM u
2
10 /
-20 20 20 30 40
( ) A UM u
3
12 /
-10 10 20 30 60
( ) A UM u
4
14 /
-15 0 20 40 80
( ) A UM u
5
16 /
-20 -15 10 40 90
( ) A UM u
6
18 /
-30 -20 0 20 100
( ) A UM u
7
20 /
-50 -30 -20 0 40
A
1
es dominada. Puede eliminarse.
A
7
es dominada. Puede eliminarse.
La matriz queda reducida a:
F
1
F
2
F
3
F
4
F
5
( ) A UM u
2
10 /
-20 20 20 30 40
( ) A UM u
3
12 /
-10 10 20 30 60
( ) A UM u
4
14 /
-15 0 20 40 80
( ) A UM u
5
16 /
-20 -15 10 40 90
( ) A UM u
6
18 /
-30 -20 0 20 100
a) Criterio de Laplace:
VE A
VE A
VE A
2
3
4
20 0 2 20 0 2 20 0 2 30 0 2 40 0 2 18
10 0 2 10 0 2 20 0 2 30 0 2 60 0 2 22
15 0 2 0 0 2 20 0 2 40 0 2 80 0 2 25
+ + + +
+ + + +
+ + + +
, , , , ,
, , , , ,
, , , , ,
( )
VE A
VE A
5
6
20 0 2 15 0 2 10 0 2 40 0 2 90 0 2 21
30 20 0 20 100 0 2 14
+ + +
+ + + +
, , , , ,
,
b) Criterio de WALD:
A
A
A
2
3
4
20
10
15



A
A
5
6
20
30


c) Criterio de HURWICZ
c.1)
0 2 ,
juegos.doc 95
Prof. Ing. Claudio L. R. Sturla
( )
( )
( )
H
H
H
2
3
4
0 2 40 0 8 20 8
0 2 60 0 8 10 4
0 2 80 0 8 15 4
+
+
+
, ,
, ,
, ,
( )
( )
H
H
5
6
0 2 90 0 8 20 2
0 2 100 0 8 30 4
+
+
, ,
, ,
c.2)
0 5 ,
( )
( )
( )
H
H
H
2
3
4
0 5 40 0 5 20 20
0 5 60 0 5 10 25
0 5 80 0 5 15 32 5
+
+
+
, ,
, ,
, , ,
( )
( )
H
H
5
6
0 5 90 0 5 20 35
0 5 100 0 5 30 35
+
+
, ,
, ,
c.3)
0 8 ,
( )
( )
( )
H
H
H
2
3
4
0 8 40 0 2 20 28
0 8 60 0 2 10 46
0 8 80 0 2 15 61
+
+
+
, ,
, ,
, ,
( )
( )
H
H
5
6
0 8 90 0 2 20 68
0 8 100 0 2 30 72
+
+
, ,
, ,
En los tres casos queda descartada la alternativa 2.
d) Criterio de SAVAGE.
La tabla de lamentos es:
F
1
F
2
F
3
F
4
F
5
A
2
10 0 0 10 60
A
3
0 10 0 10 40
A
4
5 20 0 0 20
A
5
10 35 10 0 10
A
6
20 40 20 20 0
Buscamos ahora el mnimo de entre los mximos lamentos.
Alternativa Valor mximo
A
2
60
A
3
40
A
4
20
A
5
35
A
6
40
A
4
pareciera ser el ms conveniente. Pero se puede cuestionar esta decisin con un criterio ms o menos
pesimista.
Ejemplo N 16
juegos.doc 96
Prof. Ing. Claudio L. R. Sturla
Un panadero desea conocer el nmero de panes que debe fabricar por da. Tiene dos empleados: un
obrero de panadera que le cuesta 35 UM/da y una empleada que le insume 25 UM/da.
Tiene otros gastos como impuestos, patentes, amortizaciones del negocio, instalaciones, etc. que suman
60 UM/da.
El precio de costo del pan es 0,2 UM/u sin incluir mano de obra y se vende a 0,8 UM/u.
El panadero sabe que puede vender entre 300 y 800 panes.
Para fabricar ms de 500 panes debe pagar 2 horas extra a sus empleados, lo que le supone 20 UM/da.
Adems cada pan que no se vende al pblico se vende para alimento de animales a 0,10 UM/u.
Supongamos que se fabrican 400 panes y se venden 300.
Ingreso por ventas 240 UM
Costo de lo fabricado (80) UM
Obreros, empleados e impuestos (120) UM
Beneficio por venta de
sobrantes a animales 10 UM
========
50 UM
De esta forma se puede construir la matriz de beneficios (se indican slo algunas filas).
Demanda
Oferta
300 400 500 600 700 800
60 60 60 60 60 60
50 120 120 120 120 120
40
10
300
400
500
600
700
800

_
,

'

Determinar el nmero de panes a fabricar cotidianamente aplicando los diferentes criterios. Tomar

1
2
para el criterio de HURWICZ.
Ejemplo N 17
Se va a fabricar un cierto objeto muy costoso el cual consta de tres partes anlogas y tales que el objeto
es satisfactorio si cada una de las partes lo es. Para mayor precisin puede suponerse que el objeto es
una rueda con tres radios. Para que la rueda sea satisfactoria, cada radio debe tener una resistencia
mecnica (y para dar la idea de que es costosa podemos pensar que se trata de una rueda bastante
grande que debe obtenerse en una sola pieza).
El consumidor, G, de esta rueda (el gobierno o un laboratorio astronmico) no est en condiciones de
fabricarla l mismo, por tanto la encarga a un fabricante M en las siguientes condiciones: G paga a M
una cierta cantidad para que fabrique la rueda bajo ciertas especificaciones; una vez terminada de
construir de acuerdo con dichas especificaciones, M puede tirarla a la basura (en cuyo caso cabe suponer
que su valor de rescate es cero) o puede entregarla a G el cual la someter a prueba; si la encuentra
satisfactoria G pagar a M una cantidad adicional A; en caso contrario es M quien satisface a G con una
multa B (A y B son, naturalmente, nmeros positivos).
No obstante, como G ha pagado ya a M por fabricar la rueda y como no desea dejar abierta la posibi-
lidad de que ste pueda fabricarla solo por el pago inicial, impone la condicin adicional de que M no
juegos.doc 97
Prof. Ing. Claudio L. R. Sturla
tirar la rueda a la basura, a menos que al ser ensayada resulte defectuosa (aunque, si M lo desea, puede
entregarla a G sin ninguna prueba.)
Esta prueba puede hacerse en cada uno de los tres radios, costndole a M, por cada uno, la cantidad C.
La prueba es adecuada en el siguiente sentido: G encontrar la rueda aceptable slo cuando cada radio
pase la prueba al ser realizada sta.
El problema de si se va a probar uno o todos los radios antes de aceptar la rueda (es decir, antes de
entregarla a G) corresponde a M. ste tiene la posibilidad de actuar de cuatro maneras diferentes
(estrategias puras):
I. Aceptar la rueda sin ningn ensayo previo.
II. Elegir uno de los radios al azar y probarlo. Si este radio resulta satisfactorio se acepta la rueda. Si
no lo es se la rechaza.
III. Ensayar un radio elegido al azar. Si resulta defectuoso rechaza la rueda. Si no lo es, elige uno de
los dos restantes al azar y lo prueba. Si el resultado es desfavorable, rechaza la rueda. Si no lo es, la
acepta.
IV. Probar un radio elegido al azar. Si es defectuoso, rechaza la rueda. Si es satisfactorio, elige uno
de los restantes tambin al azar y lo prueba. Si es defectuoso, rechaza la rueda. Si es satisfactorio
prueba el tercer radio y acepta o rechaza la rueda segn que el ltimo radio pase o no satis-
factoriamente la prueba.
Y adems la naturaleza tiene otras cuatro posibilidades. Puede ocurrir que ninguno, uno, dos o tres
radios sean defectuosos. Vamos a indicar estas 4 estrategias con los nmeros 0, 1, 2 y 3.
Examinaremos el beneficio de M para las diversas combinaciones de estrategias.
Si M juega a la estrategia I y la naturaleza la 0, entonces M no hace ningn ensayo y ninguno de los
rayos es defectuoso. As, pues, G encontrar la rueda satisfactoria y pagar A a M. El pago a M ser en
este caso A.
Si M juega la estrategia II y la naturaleza la 0, entonces M realizar una prueba y la rueda es satisfactoria
para G. G pagar A a M pero ste tendr que gastar C en la realizacin de la prueba. Por lo tanto el
pago de M ser A C .
Anlogamente si M juega la estrategia III y la naturaleza 0 el pago para M ser
A C 2
. Y si M emplea
la IV y la naturaleza la 0, el pago ser
A C 3 .
Si M juega la I y la naturaleza la 1, entonces M entrega la rueda a G , el cual la encontrar defectuosa.
M ha de pagar a G la multa B, por tanto el pago es -B (En este caso, como M no realiza ninguna prueba,
no tendr ningn gasto por este concepto).
Tambin es -B cuando M juega I y la naturaleza utiliza una de las estrategias 2 3.
Si la naturaleza emplea la estrategia 3, todos los radios son defectuosos. As, pues, en el caso de que M
efecte algn ensayo descubrir que la rueda es defectuosa y, por tanto, la rechazar.
Luego el pago para M es simplemente el costo de probar un radio, o sea, -C. Esto se verifica cuando la
naturaleza juega la estrategia 3 y M la II, III la IV.
Si M juega la estrategia II y la naturaleza la 1, la probabilidad de que M descubra un radio defectuosa
ser 1/3 y de que no lo descubra ser 2/3. Si descubre el defecto, el pago para l ser de -C. Si no lo
descubre, tiene que pagar la multa B y adems debe pagar por realizar la prueba, por lo tanto en este
caso el pago es -B-C. Luego la esperanza de M es:
( ) ( )
1
3
2
3
1
3
2
3
2
3
2
3
+ C B C C B C B C
De manera similar vemos que en el caso de que M juegue la II y la naturaleza a 2, el pago esperado para
M es:
( ) ( )
2
3
1
3
2
3
1
3
1
3
1
3
+ C B C C B C B C
juegos.doc 98
Prof. Ing. Claudio L. R. Sturla
Si M juega III y la naturaleza 1, la probabilidad de que M descubra el rayo defectuoso en la primera
prueba es 1/3, la de que lo descubra en la segunda
2
3
1
2
1
3
; luego la probabilidad de que el radio de-
fectuoso escape a las pruebas es:
1
1
3
1
3
1
3
+

_
,


Si el rayo defectuoso se descubre en el primer ensayo, el pago para M es -C y si se descubre en el se-
gundo es -2C; si queda sin descubrir el pago es -B-2C. Por lo tanto el pago esperado para M es:
( ) ( ) ( )
1
3
1
3
2
1
3
2
1
3
2
3
1
3
2
3
1
3
5
3
+ +

C C B C C C B C
C C
Continuando de esta manera llegamos a la matriz:
0 1 2 3
2
3
1
3
2
1
3
5
3
4
3
3 2
4
3
A B B B
A C B C B C C
A C B C C C
A C C C C
I
II
III
IV



_
,

'

El valor de este juego para M y sus estrategias ptimas al jugarlo, dependen de los valores relativos de
A, B y C.
As por ejemplo si tomamos
A B C 100 300 3 , y
(de manera que la multa por entregar una rueda
defectuosa sea muy grande en comparacin con el costo de comprobacin) obtendremos la matriz:
0 1 2 3
100 300 300 300
97 203 103 3
94 155 4 3
91 6 4 3
300
203
155
6



_
,

'

*
I
II
III
IV
As, lo peor que puede sucederle es que la rueda tenga un solo radio defectuoso y la mejor estrategia de
M ser la IV ( es decir, probar todos los radios de la rueda). Jugando dicha estrategia M puede estar
seguro de no perder una cantidad mayor a 6. Por lo tanto al hacer el contrato M debe exigir a G un pago
inicial que exceda al costo de produccin en por lo menos 6 unidades.
Por otra parte si tenemos
A B C 100 300 303 , y
(de manera que sea costoso hacer la prueba)
obtenemos la matriz:
juegos.doc 99
Prof. Ing. Claudio L. R. Sturla
0 1 2 3
100 300 300 300
203 503 403 303
506 655 404 303
809 606 404 303



_
,

'

* * * I
II
III
IV
En este caso la forma ms desfavorable de actuar de la naturaleza con respecto a M es hacer uno o ms
(no importa cuantos) radios defectuosos. Lo mejor para M ser jugar la estrategia I (o sea, no realizar
ninguna prueba). De este modo, al ser mayor el costo de comprobacin, slo puede estar seguro de que
su prdida ser a lo sumo 300.
Mediante una eleccin adecuada de A, B y C puede incluso ocurrir que la matriz no tenga una lnea
nica para elegir. As sucede si tomamos
A B C 100 900 300 , , y
en cuyo caso se obtiene la matriz:
0 1 2 3
100 900 900 900
200 900 600 300
500 800 400 300
800 600 400 300



_
,

'

I
II
III
IV
Se puede comprobar que ahora la estrategia mixta ptima para M es
1
6
0 0
5
6
, , ,

_
,
y que el valor del
juego es -650.
Por lo tanto, la manera en que debe jugar M es la siguiente: arroja un dado, si el dado sale 6 se entrega
la rueda sin realizar ningn ensayo, caso contrario probar los tres rayos. Puesto que el valor del juego
es -650 hay motivos para que M pida por lo menos 650 como pago inicial adems de su costo de
produccin.
Ejemplo N 18
Dos polticos son adversarios en una campaa electoral. Ambos deben preparar su plan de actividades
para los tres das anteriores a la eleccin. Es difcil anticipar el resultado de dicha eleccin, lo que
requiere para ganarlas un esfuerzo inteligente de los contrincantes.
El plan de ambos polticos se basa en actuar en esos 3 das sobre 2 reas que tienen 10.000 y 5.000
votantes cada una.
Para no perder tiempo, los candidatos viajan de noche y piensan pasar un nmero entero de das (0, 1, 2,
3) en las reas mencionadas. La restriccin surgira porque slo hay transporte entre las 2 zonas de
noche, lo que obliga a pasar das enteros en cada zona.
El problema es cuntos das pasar en cada lugar si ambos polticos saben que obtienen en cada rea el 50
% de los votos si pasan el mismo nmero de das. Si un poltico no va a un rea, el otro obtendr el 55
%, el 58 % o el 60 % segn pase 1, 2 3 das.
Si un poltico pasa un da en una zona y el otro 2, el segundo tendr el 53 % de los votos y si pasa tres
das obtendr el 55 % de los votos.
Finalmente si un poltico pasa 2 das y el otro pasa tres das en cada zona, el segundo poltico obtendr
el 52 % de los votos.
Por supuesto ningn poltico puede esperar a ver que hace el otro ya que los arreglos para los viajes
deben ser hechos con anticipacin.
Cul ser la estrategia ptima?
juegos.doc 100
Prof. Ing. Claudio L. R. Sturla
Las estrategias de cada poltico a los que llamaremos I y II son pasar 3 das en la zona de 10.000 vo-
tantes y 0 en la otra 2 en la de 10.000 y 1 en la de 5.000 1 en la de 10.000 y 2 en la otra 0 en la de
10.000 y 3 en la de 5.000.
Es fcil entonces estudiar cuantos votos obtiene I en cada interseccin de estrategias.
I) 3 das en 10.000; 0 das en 5.000 - II) 3 en 10.000; o en 5.000
En este caso pasan el mismo nmero de das en las 2 reas. De acuerdo a esto es evidente que I obtiene
10.000 * 0,5 + 5.000 * 0,5 = 7.500
I) 3, 10.000; 0, 5.000 - II) 2, 10.000; 1, 5.000
En este caso I pasa ms das en la de 10.000 votos y el poltico II pasa 1 da ms en la de 5.000. Luego I
obtendr el 52 % en la primer zona y el (100 - 55) % en la segunda
10.000 * 0,52 + 5.000 * 0,45 = 7.450
I) 3, 10.000; 0, 5.000 - II) 1, 10.000; 2, 5.000
I pasa dos das ms en la zona de 10.000 que II. II pasa un da por lo que obtiene el 55 % de los votos y
el poltico II pasa dos das en la de 5.000 votos sin haber pasado I por la zona (58 % de los votos)
10.000 * 0,55 +5.000 * 0,42 = 7.600
I) 3, 10.000; 0, 5.000 - II) 0, 10.000; 3, 5.000
10.000 * 0,6 +5.000 * 0,4 = 8.000
I) 2, 10.000; 1, 5.000 - II) 3, 10.000; 0, 5.000
10.000 * 0,48 + 5.000 * 0,55 = 7.550
I) 2, 10.000; 1, 5.000 - II) 2, 10.000; 1, 5.000
10.000 * 0,5 +5.000 * 0,5 = 7.500
I) 2, 10.000; 1, 5.000 - II) 1, 10.000; 2, 5.000
10.000 * 0,53 + 5.000 * 0,47 = 7.650
I) 2, 10.000; 1, 5.000 - II) 0, 10.000; 3, 5.000
10.000 * 0,58 + 5.000 * 0,45 = 8.050
I) 1, 10.000; 2, 5.000 - II) 3, 10.000; 0, 5.000
10.000 * 0,45 + 5.000 * 0,58 = 7.400*
y as siguiendo.
La matriz de pago quedar:
310000 2 10000 110000 0 10000
0 5000 15000 2 5000 3 5000
7 500 7 450 7 600 8 000
7 550 7 500 7 650 8 050
7 400 7 350 7 500 7 900
7 000 6 950 7100 7 500
310000 0 5000
2 10000 15000
110000 2 5000
0 10000 3 5000
, , , ,
, , , ,
. . . .
. . . .
. . . .
. . . .
, ; ,
, ; ,
, ; ,
, ; ,

_
,

'

Actualizado al 14/9/2.002
D:\INVESTIGACIN OPERATIVA\FRBA JUEGOS
Este archivo fue impreso el 18/03/2008.
juegos.doc 101

Vous aimerez peut-être aussi