Académique Documents
Professionnel Documents
Culture Documents
Sujeta a:
2 X, + X 2 + 3 X 3 = 1
437
Siendo a una variable aleatoria que se distribuye uniformemente en el intervalo [- 1, 1],
Por ser a una variable aleatoria en el intervalo [ - 1 , 1 ] sus funciones de densidad y de distribución
serán:
Luego:
Calculando el valor de z:
438
Si tenemos el problema:
Sujeta a:
MAX Z = 2 X! + X 2
Sujeta a:
Donde W ] y W 2 son las variables duales asociadas con cada una de las restricciones.
439
F(X)
440
CAPÍTULO XV
ANÁLISIS DE MARKOV
INTRODUCCIÓN
El número de llamadas telefónicas recibidas en una estación telefónica hasta cierto instante t.
La sucesión de tiempos que permanecen en el buffer de un conmutador los paquetes de una
conexión en espera de ser transmitidos.
La sucesión de tamaños (en bytes) de los paquetes que llegan a un conmutador de red.
De una manera más formal, un proceso estocástico se define como una familia de variables
aleatorias , definidas sobre un mismo espacio de probabilidad , que representa el
comportamiento aleatorio del fenómeno que se estudia. En este contexto s suele representar el valor
de una variable de interés medida en el instante s, o el valor que toma esa variable sobre el i - ésimo
objeto que interviene en el fenómeno analizado.
En las aplicaciones que veremos, cuando T es continuo suele ser y cuando es discreto
suele ser T = N. Ejemplos:
= Número de llamadas telefónicas recibidas en una central telefónica hasta cierto instante t.
Los elementos co e Q son los posibles resultados aleatorios de la observación del fenómeno, P es
la función que asigna a los co su probabilidad de ocurrencia , y B es la colección de conjuntos de
a los que se puede asignar de modo consistente un valor de probabilidad.
441
De acuerdo con esta definición, a cada fijo, el proceso le asocia los valores que
denominada trayectoria del proceso constituyen una función de S en R asociada a De esta forma,
podemos considerar un proceso estocástico como una función de dos variables de
en R en la que:
Desde esta perspectiva, puede entenderse un proceso estocástico como el conjunto de todas las
posibles formas en que puede evolucionar la variable en estudio (trayectorias) más una distribución de
probabilidad sobre dicho conjunto, que nos indique cuál es la probabilidad de que se produzca cada
trayectoria particular.
Procesos Puntuales
- El conjunto de instantes en que se producen los nacimientos de los individuos de una población.
En estos dos ejemplos, el continuo sobre el que se encuentran distribuidos los puntos es el tiempo.
El análisis de los procesos puntuales se realiza habitualmente a través de sus procesos contadores
asociados.
442
Dado un proceso puntual definido sobre un espacio continuo T, se define su proceso contador
asociado como aquel proceso que a cada subconiunto le asigna el número N(A) de ocurrencias
del proceso puntual localizadas en A. Cuando T es el tiempo, el proceso contador suele expresarse
como donde Nt representa el número de sucesos puntuales que han ocurrido en [0,t],
Uno de los procesos contadores más importantes es el proceso de Poisson, proceso que se usa
extensamente en teoría de colas.
El Proceso d e Poisson H o m o g é n e o
es de incrementos independientes
Como ejemplo en los que esta condición se da frecuentemente, puede citarse las llegadas de
clientes a una cola. En este caso Nt representa el número de clientes llegados a la cola en el intervalo
de tiempo (0, t].
443
Propiedades del proceso de Poisson
que, como se
observa, sigue una distribución exponencial de parámetro independientemente de n y T n .
El Proceso d e Poisson no H o m o g é n e o
Cuando las condiciones que definen el proceso de Poisson se modifican de modo que la intensidad
del mismo (el valor de X) sea función de t, esto es:
es de incrementos independientes
444
donde: se denomina función paramétrica del proceso.
PROCESOS DE MARKOV
En muchos sistemas basta conocer su estado actual y las reglas por las que se rige su
comportamiento para predecir su evolución futura. La idea subyacente es que lo que le haya sucedido
al sistema hasta llegar al estado actual no aporta, en orden a predecir su estado en el futuro, ninguna
información que no esté ya recogida en las variables que definen su estado presente (principio de
independencia entre el futuro y el pasado una vez que se conoce el presente). Esta idea puede
generalizarse en un contexto de probabilidades y constituye la base de la definición de los procesos de
Markov.
En otras palabras, es un proceso tal que la distribución condicional de su valor futuro dada
toda su evolución hasta el presente depende sólo del valor actual y es independiente del
pasado.
Procesos S e m í m a r k o v i a n o s
En el caso particular de que estas variables sigan una distribución geométrica (cuando el proceso
es en tiempo discreto) o exponencial (cuando el proceso es en tiempo continuo), con parámetro
445
dependiente sólo del estado actual, el proceso es de Markov, debido a la falta de memoria de estas
variables.
C a d e n a s d e M a r k o v e n T i e m p o Discreto
Condición de Markov
Las cadenas de Markov en tiempo discreto constituyen el modelo de proceso de Markov más
simple. El tiempo T es discreto (T = N; en general se llaman etapas a las unidades de tiempo discretas)
y también es discreto (finito o numerable) el espacio de estados, al que llamaremos E. La condición de
Markov se expresa en este caso de la forma:
lo que significa que la probabilidad de pasar del estado i al estado j en una etapa es independiente
de cuál sea esta etapa.
Obviamente
Ejemplo
446
Donde
Para calcular esta probabilidad, si definimos las matrices de probabilidades de transición en una y
n etapas respectivamente, como:
puede probarse el siguiente resultado, conocido como ecuación de Chapman - Kolmogorov: P(n) = Pn
Ejemplo
447
y las probabilidades de estado en la tercera etapa son:
448
449
450
Como puede apreciarse, las sucesivas potencias de la matriz van pareciéndose cada vez más
entre sí; de hecho, a partir de las matrices son prácticamente iguales (las diferencias
que pudiera haber están por debajo del octavo decimal). Ello significa que las probabilidades de estado
tras n etapas ya no cambian prácticamente a partir de la etapa 17. Tales probabilidades serían:
Por tanto, si el buffer está inicialmente vacío, transcurrido un número de etapas mayor que 17, la
probabilidad de que esté vacío es de 0,207; la probabilidad de que esté ocupado por un solo dígito es
0,235; y la probabilidad de que esté lleno es 0,117.
451
Probabilidades de etapa de primer paso
Otro problema de interés suele ser el cálculo de la probabilidad de que, partiendo del estado i, la
cadena llegue por primera vez al estado j transcurridas n etapas. Esta probabilidad suele denotarse
como:
La probabilidad de que la cadena, habiendo partido del estado i, alcance alguna vez el estado j es
entonces:
y por tanto:
En nuestro ejemplo:
Calculemos la probabilidad de que, partiendo del buffer vacío, alguna vez llegue a haber 3 dígitos
en el mismo. Para ello debemos encontrar:
452
y resolver:
Así pues, la probabilidad de llegar al estado 3 (tener 3 dígitos en el buffer) partiendo del estado 0
(buffer vacío) es: f 03 = F 03 (1) = 0,731635
El número medio de etapas que se tarda en tener 3 dígitos partiendo del buffer vacío es:
• Estados recurrentes positivos: Un estado j se dice recurrente positivo si Pjj < oo , esto es,
si el tiempo medio que se tarda en regresar a él es finito.
• Estados recurrentes nulos: Un estado j se dice recurrente nulo, esto es, si se tarda un
tiempo medio infinito en regresar a él.
• Estados absorbentes: Un estado i se dice absorbente si p„= 1, esto es, si una vez que la
cadena llega a este estado va no puede pasar a otro distinto de él.
453
• Estados accesibles: Un estado j es accesible desde otro estado i si:
• Estados comunicantes: Dos estados i, j comunican entre sí cada uno de ellos es accesible
desde el otro.
• Estados periódicos: Un estado recurrente i se dice periódico de periodo d si d es el máximo
común divisor de los índices n para los cuales Un estado con periodo 1 se dice
aperiódico. Puede probarse que si el estado i es aperiódico, entonces existe un entero no tal
que
a) Si C es irreducible, entonces sus estados son todos transitorios o son todos recurrentes.
EJEMPLO
454
• El estado 1 es recurrente, pues si el proceso comienza en él, permanece en él para siempre.
• Los estados 2 y 5 son transitorios, ya que pueden ser visitados unas cuantas veces y no volver
a ellos nunca más.
• Los estados 0, 3 y 4 son recurrentes, ya que una vez que el proceso llegue a uno de ellos
permanece en ese conjunto para siempre.
• El conjunto {0, 3,4} es un conjunto cerrado de estados; también es irreducible.
• El conjunto {1} es también cerrado e irreducible.
• El conjunto {2,5} no es cerrado.
• El conjunto {0,1,2,3,4,5} es cerrado pero no irreducible.
Hay una serie de resultados que no se cumplen para Cadenas de Markov con un número infinito
de estados, pero que sí se verifican si este número es finito. Por ejemplo, en una cadena con infinitos
estados podría ocurrir que ninguno fuese recurrente, pero en una cadena finita es evidente que debe
existir algún estado de esta clase. Más aún, todo conjunto de estados cerrado y finito tiene al menos un
estado recurrente.
Teorema 1: Sea R el conjunto de estados recurrentes de una Cadena de Markov con espacio de
estados finito y sin conjuntos cerrados disjuntos, entonces:
Distribución Estacionaria d e u n a C a d e n a d e M a r k o v
455
Distribución de Equilibrio de una Cadena de Markov
El siguiente teorema nos indica en qué casos existe la distribución límite de una Cadena de
Markov.
Teorema 2:
(a) es una Cadena de Markov irreducible y recurrente positiva, entonces existe una
única solución no degenerada de las ecuaciones:
verifica que:
(b) Si el vector de probabilidades iniciales p<0) se elige de modo que , entonces la cadena
es un proceso estacionario y ergódico.
Teorema 3: Una Cadena de Markov aperiódica e irreducible es recurrente positiva si existe una
solución no negativa del sistema de ecuaciones:
tal que:
456
C a d e n a s d e M a r k o v e n Tiempo Continuo con Espacio d e Estados Discretos
siendo
Las Cadenas de Markov en tiempo continuo homogéneas verifican las siguientes propiedades:
(1) cada vez que alcanza el estado i la cantidad de tiempo que la cadena permanece en ese
estado antes de transitar a otro estado sigue una distribución exponencial de parámetro ?i
dependiente del estado de partida.
(2) Cuando el proceso abandona el estado i, entra en otro estado j i con probabilidad p,,,
verificándose:
En otras palabras, una cadena de Markov homogénea en tiempo continuo es un proceso estocástico
que se mueve de un estado a otro de acuerdo con una cadena de Markov en tiempo discreto, pero que
permanece en cada estado durante un tiempo exponencialmente distribuido (con parámetro dependiente
del estado). Además el siguiente estado j al que se mueve el proceso es independiente del tiempo que
haya permanecido en el estado i (si no fuera así se violaría la condición de Markov).
De esta forma, una cadena de Markov homogénea en tiempo continuo queda definida por la
matriz de transición de probabilidades:
De modo análogo al caso de tiempo discreto (en que P ' = Pn), se cumple (ecuación de Chapman-
Kolmogorov): P (t + s) = P (t) P (s)
Así mismo, si pi (t) = P (^ (t) = i), p (t) = (p, (t), p2 (t),...) se tiene:p (t) = p(0) P(t)
Obviamente, la pregunta que cabe hacerse ahora es, ¿de qué modo puede calcularse P(t)?
457
tiempo medio que la cadena permanece en el estado i.
de donde:
458
de donde:
donde:
Debe señalarse que en la práctica no resulta, en general, eficiente calcular P(t) de esta forma,
resultando preferible en muchas ocasiones tratar de obtener los p¡j (t) directamente a partir de alguna
de las ecuaciones de Kolmogorov. Esto es lo que hemos hecho ya en el caso del proceso de Poisson
homogéneo.
Por último, en analogía con el resultado obtenido para las cadenas en tiempo discreto, a menudo
la probabilidad de que la cadena de Markov se encuentre en el estado j transcurrido un tiempo muy
largo, converge a un valor (probabilidad ergódica) independiente del estado inicial, esto es:
459
El valor de puede interpretarse como la proporción de tiempo que el sistema permanece en el
estado j.
y por tanto la distribución ergódica debe cumplir: junto con la condición natural de que
Teorema 3: Una Cadena de Markov en tiempo continuo es ergódica si es irreducible y todos sus
estados son recurrentes positivos.
El sistema de ecuaciones admite una interpretación que resulta bastante intuitiva y fácil
de comprender. Si escribimos su desarrollo obtenemos:
En este sistema de ecuaciones, la probabilidad puede interpretarse como la tasa con que el
proceso abandona el estado j.
Así mismo, la probabilidad puede interpretarse como la tasa con que el proceso llega
Claramente, cuando el proceso se encuentra en equilibrio ambas cantidades deben ser iguales.
460
EJERCICIOS RESUELTOS
Una matriz estocástica es regular si una potencia de la matriz solamente tiene componentes
positivos.
es la matriz unitaria I.
es la matriz A.
Por lo tanto, toda potencia par de A es la matriz unitaria I y toda potencia impar de A es la
matriz A. Por lo tanto, toda potencia de A tiene componentes cero, entonces A no es regular.
Puesto que todas las componentes en D 3 son positivas, D es una matriz estocástica regular.
461
Buscamos un vector de probabilidad t = (X, 1 - X), tal que t A = t. El anterior vector, también se
puede denominar (X, Y):
y luego igualamos unas a otras las componentes respectivas para obtener las dos ecuaciones
siguientes:
La matriz A n tiende a la matriz T, cuyas filas son cada una el punto fijo t; de donde A n tiende a:
Para despistar al enemigo se ha dado la orden a los centinelas de hacer la ronda de la siguiente
m a n e r a aleatoria: Vigilar durante cinco minutos en uno de los cuatro puestos, designado en el
462
último momento por el mando; después, tirar a cara o sello. Si sale sello, ir al primer puesto que
se encuentre a su izquierda (si sale cara a su derecha) y vigilar en él otros cinco minutos; echar
de nuevo la moneda, seguir la misma regla precedente y así sucesivamente.
• De 100 individuos que consumían Daria, resulta que tras la campaña el 6 0 % continúa
con Daria, el 2 5 % se pasa a Deria y el resto a Diria.
• De 1 0 0 individuos consumidores de Deria, el 5 0 % continúa con dicho producto, el 3 0 % se
pasa a Daria y el resto a Diria.
• Finalmente, de 100 consumidores de Diria, el 4 0 % sigue con Diria, el 4 0 % se pasa a Daria
y el resto a Deria.
463
a) ¿Cuál de las campañas es más eficaz?
a) Se puede interpretar como una Cadena de Markov, cuya matriz de transición es:
Las campañas de las compañías Deria y Diria mejoran el porcentaje de mercado al pasar de
3 0 % a 3 1 , 5 % y de 2 0 % a 21,5%. Para ver si continuando con los mismos métodos de publicidad
se llega a una situación estacionaria, analizamos el grafo asociado a esta cadena:
b) Este grafo es fuertemente conexo y no periódico, lo que nos indica que la cadena es regular
y existirá una distribución límite en caso que la campaña de publicidad se repitiera. Esta
distribución (X^ X 2 X3) es un autovalor por la izquierda de M:
464
0 , 4 X! - 0 , 2 5 X 2 - 0 , 1 5 X 3 =0
- 0 , 3 XÌ + 0 , 5 X2 - 0,2 X 3 = 0
- 0 , 4 Xt - 0,2 X 2 + 0 , 6 X3 = 0
donde la primera ecuación es redundante; las otras dos ecuaciones, ¡unto con Xy + X 2 + X 3 = 1
465
EJERCICIOS PROPUESTOS
I • Suponga que la probabilidad de lluvia mañana es 0,5 si hoy llueve y que la probabilidad de un día
claro (sin lluvia) mañana es 0,9 si hoy está claro; suponga además que estas probabilidades no cambian
si también se proporciona información sobre el clima de días anteriores a hoy.
a) Explique por qué las suposiciones establecidas implican que la propiedad markoviana se cumple
para la evolución del clima.
b) Formule la evolución del clima como una Cadena de Markov, definiendo sus estados y dando
su matriz de transición (de un paso).
2 • Considere el siguiente modelo para el valor de una acción; suponga ahora que el modelo del
mercado de acciones se cambia; el que una acción suba o no mañana depende de si subió o no hoy y
ayer. En particular, si la acción subió los dos días, la probabilidad de que suba mañana es 0,9. Si la
acción subió hoy pero ayer bajó, mañana subirá con probabilidad de 0,6. Si la acción bajó hoy pero ayer
subió, entonces mañana subirá con probabilidad de 0,5. Por último, si bajó los dos días, la probabilidad
de que mañana suba es 0,3. Si se define el estado como la representación de hecho de que la acción
baje o suba, el sistema ya no se puede representar como una cadena de Markov. Sin embargo, se
puede transformar en una si se definen los estados como sigue: Estado 0: La acción aumentó hoy y
ayer; Estado 1: La acción aumentó hoy y ayer bajó; Estado 2: La acción bajó hoy y ayer aumentó;
Estado 3: La acción bajó hoy y ayer. Esto conduce a una cadena de Markov de cuatro estados con la
siguiente matriz de transición:
'0,9 0 0,1 0 ^
0,6 0 0,4 0
p= 0 0,5 0 0,5
0,3 0 0,7J
Si la acción sube o no mañana, depende de si subió o no hoy y ayer. Si la acción subió hoy y ayer,
mañana subirá con probabilidad a, . Si la acción subió hoy y ayer bajó, mañana subirá con probabilidad
a 2 . Si la acción bajó hoy y ayer subió, la probabilidad de que suba mañana es a 3 . Por último, si la
acción bajó hoy y ayer, la probabilidad de que suba mañana es a 4 .
3 • Una empresa de abogados emplea a tres categorías de abogados: principiantes, con experiencia
y socios; durante un año determinado hay una probabilidad 0,15 que un abogado principiante sea
466
ascendido a abogado con experiencia y una probabilidad 0,05 que deje la empresa; también hay una
probabilidad 0,20 que un abogado con experiencia sea ascendido a socio y una probabilidad 0,10 que
deje la empresa; además, existe una probabilidad 0,05 que deje la empresa.
Supongamos que la meta a largo plazo de esta empresa es tener 50 abogados principiantes, 30
con experiencia y 10 socios. Para alcanzar este censo de estado estable , ¿ cuántos abogados de cada
tipo deben contratar cada año ?
Si no se dispone de más información, es razonable suponer que el ratón elegirá una puerta al azar
al cambiarse de un compartimiento a otro; como cada una de las puertas tiene la misma probabilidad de
ser elegida, la probabilidad de que un ratón pase a uno de los otros compartimientos es 0,5; esto nos da
la matriz de transición:
Se pregunta a largo plazo, qué tiempo pasará el ratón en cada uno de los compartimientos.
En un día dado, el clima en Manizales puede ser bueno, indiferente o malo; si el clima es bueno
hoy, mañana estará bien con una probabilidad de 0,6, indiferente con una probabilidad de 0,20 y malo
con una probabilidad de 0,20; si el clima es indiferente hoy, mañana será bueno, indiferente o malo con
probabilidades de 0,25,0,50 y 0,25, respectivamente; por último, si el clima es malo hoy, las probabilidades
que mañana el clima sea bueno, indiferente o malo son de 0,25, 0,25 y 0,50, respectivamente. Es de
anotar que este problema se resuelve con la suposición que el clima de hoy se ve afectado únicamente
por el clima de ayer y no por lo que haya sucedido en días anteriores.
467
CAPÍTULO XVI
INTRODUCCIÓN
La mayoría de los autores utilizan los términos multicriterio y/o multiobjetivo indistintamente. Es
importante aclarar que multicriterio se emplea cuando los problemas de decisión se presentan con
objetivos Z\, z2, z3, ... , zB, con n > 2, es decir, para datos discretos, y los problemas de decisión
multiobjetivo se dan cuando los datos son continuos. Estos métodos también son denominados
Optimización Vectorial y están basados en criterios explícitos para evaluar varias alternativas. Se
utilizan siempre que un grupo de personas debe tomar una decisión importante en la que concurren
distintos aspectos, complejos o controvertidos, fundamentalmente en las etapas de selección y evaluación
de alternativas. Un análisis multicriterio es muy eficaz como orientación en la discusión y consenso del
equipo. A menudo, tras una discusión, los miembros del equipo pueden decidir alterar su evaluación
sobre una o más alternativas y luego ajustar sus puntuaciones en consonancia. Tras la elección de las
alternativas y la determinación de los criterios que se van a utilizar, se ponderan éstos según su importancia,
a los cuales se les asigna un peso específico acorde con su trascendencia en los resultados.
El análisis multicriterio constituye una forma de modelizar los procesos de decisión, en los que
entran en juego: una decisión a ser tomada, los eventos desconocidos que pueden afectar el o los
resultados, los posibles cursos de acción y el o los resultados mismos. Mediante los modelos multicriterio
el decisor podrá estimar las posibles implicaciones que puede tomar cada curso de acción, de modo que
se pueda obtener una mejor comprensión de las vinculaciones entre sus acciones y sus objetivos.
Se deben definir los siguientes términos: atributos, objetivos, metas, restricciones y criterios.
Atributos: Son los puntos de vista considerados relevantes para el análisis y/o resolución de un
problema. Es decir, un atributo es una característica intrínseca de las alternativas susceptibles de ser
medidas. Constituyen la base para la toma de decisiones, base que puede ser medida y evaluada. Es la
evidencia sobre la cual se basa una decisión o, dicho de otro modo, es un aspecto medible de un juicio,
por el cual puede ser caracterizada una dimensión de las alternativas bajo análisis.
469
Estos criterios pueden representar diferentes aspectos de la teleología: objetivo, metas, valores de
referencia, niveles de aspiración o utilidad. En el planteo de la matriz de decisión o en la caracterización
de un problema, la identificación de los criterios pertinentes al mismo es de gran importancia para el
logro de los objetivos. La forma en que puede ser medido o caracterizado el criterio también es un
aspecto de gran importancia, ya que de ello dependerá en gran parte el resultado final del proceso de
evaluación.
Desde un punto de vista operativo, los atributos pueden ser clasificados en tres grupos:
i) De beneficio, en los que la preferencia o la utilidad es creciente con el valor o puntaje del
mismo
ii) De costos, los que ofrecen una utilidad monotónica decreciente: cuanto mayor el puntaje,
menor es la preferencia
iii) No monótonos, tales como el contenido de azúcar en la sangre, donde la utilidad máxima es
obtenida en un valor intermedio dentro del rango posible.
Restricciones: Corresponden a las condiciones que se deben cumplir en los diferentes problemas.
Las restricciones son generadas a partir de la existencia de recursos limitados.
Criterios: Son una herramienta que permite una evaluación de alternativas de acuerdo con un
particular punto de vista. El término criterio se utiliza como una acepción general que engloba tres de
los conceptos precedentes, es decir, los criterios constituyen los atributos, objetivos o metas que se
consideran relevantes para un problema de decisiones.
¿Qué diferencias hay entre objetivos, metas y restricciones? En el contexto que nos ocupa la
distinción entre los tres conceptos es clara. Mientras que la meta establece un nivel aceptable del
atributo, el objetivo lo optimiza, maximizando o minimizando. Para una meta, el segundo miembro es
simplemente un valor al que aspiramos; sin embargo, en una restricción siempre debemos alcanzar ese
valor, porque en caso contrario la restricción no se cumple y sería una solución imposible. En
Programación Matemática con un único objetivo no existe el concepto de meta y se trabaja únicamente
con restricciones.
Ejemplo
470
El criterio d e o p t i m a l i d a d P a r e t i a n a
En 1896, el Economista Italiano Vilfredro Pareto introdujo un criterio de optimalidad que ha recibido
su nombre y que puede considerarse crucial en teoría económica. En su formulación inicial, Pareto
considera que una colectividad se encuentra en un estado óptimo si ninguna persona de esa colectividad
puede mejorar su situación sin que empeore la situación de alguna otra persona de la misma. Esta clase
de optimalidad se denomina también eficiencia paretiana.
El atractivo del criterio de Pareto es que, aún tratándose indiscutiblemente de un juicio de valor,
es muy débil, por lo que la mayoría de las personas lo aceptarían razonablemente. Este criterio de
optimalidad paretiana puede transferirse de una manera directa de la economía al análisis decisional
multicriterio. Para ello, basta sustituir el concepto original de Pareto de "sociedad" o "colectivo" de
personas por el de conjunto de criterios. Así, cada criterio individual representa a una persona en esta
nueva interpretación. Esta traslación del concepto de optimalidad paretiana juega un papel esencial en
los diferentes enfoques desarrollados dentro del paradigma multicriterio. Puede decirse que la eficiencia
paretiana es una condición exigida como necesaria para poder garantizar la racionalidad de las soluciones
generadas por los diferentes enfoques multicriterio.
El concepto de optimalidad paretiana dentro del campo multicriterio puede definirse formalmente
de la siguiente manera. Un conjunto de soluciones es eficiente (o pareto óptimas) cuando está formado
por soluciones factibles (esto es, que cumplen las restricciones), tales que no existe otra solución
factible que proporcione una mejora en un atributo sin producir un empeoramiento en al menos otro de
los atributos. A título de ejemplo, supongamos que en un problema de selección de un modelo de
caza-bombardero el centro decisor considera como relevantes los siguientes atributos: velocidad, carga
máxima, coste y maniobrabilidad.
Todos los enfoques multicriterio pretenden obtener soluciones que sean eficientes en el sentido
paretiano que acabamos de definir. Incluso dentro de la programación multiobjetivo, el primer paso
consiste en obtener el conjunto de soluciones factibles y eficientes. Esto es, el conjunto de soluciones
posibles se particiona en dos subconjuntos disyuntos. El subconjunto de soluciones factibles no eficientes
y el subconjunto de soluciones factibles y eficientes. Una vez realizada tal partición, se introducen de
diferentes maneras las preferencias del centro decisor con el objeto de obtener un compromiso entre
las soluciones factibles y eficientes.
Las tasas de intercambio tienen un doble interés dentro de la metodología multicriterio. Por una
parte, constituyen un buen índice para medir el coste de oportunidad de un criterio en términos de los
otros que estemos considerando. Por otra, el concepto de tasa de intercambio juega un papel crucial en
el desarrollo de los métodos interactivos multicriterio. La interacción se traduce en una especie de
diálogo en la que el que toma las decisiones transmite al analista sus preferencias medidas por las tasas
de intercambio o trade-off.
471
PRINCIPALES ENFOQUES MULTICRITERIO
La diferenciación conceptual entre atributos, objetivos y metas nos permite efectuar una primera
aproximación metodológica a los diferentes enfoques multicriterio. Así, cuando la toma de decisiones
se sitúa en un contexto de objetivos múltiples, el enfoque multicriterio a considerar es la programación
multiobj etivo. Si la toma de decisiones se realiza en un contexto de metas múltiples, el enfoque multicriterio
es la programación por metas.
Existen muchas situaciones en las que interesa contemplar varias características difíciles de
combinar en un único objetivo: rentabilidad y riesgo en las inversiones, beneficio a corto plazo y
crecimiento de la empresa a largo plazo, coste y calidad de los servicios, etc. En general, los problemas
multicriterio pueden tener objetivos intrínsecamente diferentes u objetivos intrínsecamente similares.
En el primer caso, unas veces se puede determinar el coste de oportunidad de un objetivo frente a los
demás y en otras los criterios pueden ordenarse por su importancia. Tanto la programación multiobj etivo
como la programación por metas son técnicas útiles en la toma de decisiones en las que se dan este tipo
de circunstancias.
Uno de los muchos problemas reales en los que se ha aplicado la programación multiobj etivo es el
uso múltiple del suelo público. Así, la administración se puede plantear que la gestión del suelo tenga en
cuenta la rentabilidad y los valores históricos, ecológicos, de medio ambiente, de recursos hidráulicos,
etc. Muchas veces también se pretende conservar ciertas tierras públicas en su condición natural, que
proporcionen hábitat y alimento, tanto a la vida salvaje como a los animales domésticos y, por último,
tengan en cuenta el uso recreativo.
Muchos de estos objetivos entran en conflicto. Las asociaciones agrícolas desean más tierras de
cultivo y/o pastoreo, las compañías mineras desean derechos de explotación y los grupos de conservación
del medio ambiente desean mantener algunas áreas en su estado natural.
472
PROGRAMACIÓN MULTICRITERIO
Las variables decisión del modelo, X! y X2, representan las hectáreas dedicadas a pastoreo de
ovejas y las reservadas para caza respectivamente. Los dos objetivos a maximizar son la utilidad y el
valor recreativo de la finca. La función que representa este último se ha construido a partir de una escala
relativa arbitraria de 0 a 4, dando el máximo cuando la superficie se explota sólo para caza y el valor 1
cuando se introduce ganadería. Por diversas razones se considera que no se deben dedicar más de 1500
has a pastoreo, ni más de 1000 has exclusivamente a caza. La superficie total de la finca es de 2000 has.
El punto (Z\, Z2) formado por los elementos de la diagonal de la matriz de pagos, se llama punto
ideal, donde los dos objetivos alcanzan su óptimo y es normalmente inalcanzable. Tanto este punto
como el punto anti-ideal, que es aquel en que Zx es 35000 y Z2 vale 3500 son importantes en los
métodos de resolución de problemas multicriterio. El punto anti-ideal es una "mala solución", pero es
útil, por ejemplo, para "normalizar" los objetivos medidos en diferentes unidades y con diferentes valores
absolutos. Además, la diferencia entre los valores ideales y antiideales definen un intervalo de valores
para cada criterio que es necesario conocer en algunos métodos de resolución de este tipo problemas.
TABLA 1 MATRIZ DE P A G O S
473
TABLA 2 VALORES DE LAS VARIABLES D E C I S I Ó N Y DE LOS OBJETIVOS EN LOS P U N T O S EXTREMOS
La Tabla 2 recoge las coordenadas de los puntos extremos OABCD en el espacio de las variables
de decisión representadas en la Figura 1, así como las de sus correspondientes objetivos que están
representados gráficamente en la Figura 2 por los puntos O'A'B'C'D'.
474
Cuando hay objetivos en conflicto como en este caso, el punto ideal donde todos los objetivos
alcanzan su óptimo no existe. Por tanto, la resolución de un modelo multicriterio lo que hace es encontrar
el conjunto eficiente. Un punto pertenece al conjunto o frontera eficiente cuando cumple las restricciones
y no hay otra solución posible que mejore alguno de los objetivos sin empeorar al menos otro. Observando
la Figura 2, es evidente que la frontera eficiente de nuestro problema es el segmento C' B'. Observar
que el conjunto eficiente se puede definir en términos de puntos extremos eficientes (B' y C') o en
términos de puntos extremos e interiores (el segmento B ' C '). También es interesante resaltar que la
pendiente del segmento B' C' nos proporciona la tasa de intercambio entre los objetivos y por tanto es
una medida del coste de oportunidad de uno por otro.
Obtenido el conjunto de puntos eficientes se puede optar por una solución atendiendo a criterios
subjetivos en problemas pequeños. Por otra parte, es obvio que se ha podido resolver gráficamente el
problema anterior por ser un modelo con dos variables de decisión y dos objetivos y se ha hecho así por
motivos pedagógicos. En problemas de mayor tamaño se puede obtener por diversos métodos. Entre
ellos están el método de las restricciones y el de las ponderaciones.
Método Stem
Técnicas Interactivas
Método de Zionts & Wallenius
Método de Geoffrion
475
CARACTERÍSTICAS DE LAS TÉCNICAS GENERADORAS
Desde el punto de vista de la relación entre el analista y el decisor, el flujo de información va del
primero hacia el segundo. Dicho de otro modo, el analista proporciona al decisor la información que
éste necesita para decidir. Esta información viene dada en términos de soluciones eficientes. Es, por
tanto, el decisor quien, a la vista de las alternativas que posee, elige la que le parece más satisfactoria.
Aplicando este método, se generan puntos extremos eficientes, a diferencia del anterior en A que
se generaban puntos extremos e interiores. Esta técnica consiste en agregar todos los objetivos en una
función donde a cada uno se le asigna un peso W no negativo de la siguiente manera:
donde W > 0 y se cumplen las restricciones del problema. Variando paramétricamente los pesos
W se puede generar o al menos aproximar el conjunto eficiente.
Sujeta a:
Por ejemplo, para los valores de W¡ = 1 y W2 = 2 se obtiene el punto extremo eficiente B' y para
W, = 1 y W 2 = 10 se obtiene el C'.
Es necesario hacer hincapié en que tanto este método como los demás métodos multicriterio no
tienen en cuenta las preferencias del que toma las decisiones. Por tanto, los W elegidos no guardan
ninguna relación con dichas preferencias. Dichos pesos juegan el papel de parámetros que se hacen
variar arbitrariamente con el fin de generar los puntos extremos eficientes del problema que estemos
considerando.
476
Por último, tanto el método de las restricciones como el de las ponderaciones sólo garantizan
aproximaciones al conjunto eficiente. Por detallado que sea el análisis paramétrico nunca podremos
tener la certeza de no haber omitido algún punto eficiente.
Este método consiste en optimizar uno de los objetivos, mientras que los otros se tratan como
restricciones paramétricas. Está demostrado que para cada conjunto de valores del vector de segundos
miembros o términos independientes se obtiene un punto eficiente, bien extremo 0 interior. Por tanto,
para resolver el problema se puede utilizar el software de programación lineal. El modelo sería el
siguiente
Para cada valor del parámetro P se genera un punto eficiente. El intervalo de variación de P será
el que nos marca el punto ideal y anti-ideal. En la Tabla 3 se recogen algunos puntos de la frontera
eficiente. Es importante saber que este método garantiza soluciones eficientes sólo cuando las
restricciones paramétricas se verifican estrictamente en el óptimo. Esto ocurre en todos los puntos
presentados en la Tabla 3, dado que Z2 y P coinciden.
477
En general, el método de las restricciones cuando hay n objetivos sería
MAXIMIZAR Zk (X)
Restricciones del modelo: En los objetivos que haya que minimizar y estén como restricciones
paramétricas se invertirá el sentido a la restricción. Así, si hubiera que minimizar Zx se colocaría
Otro método es el método multicriterio NISE (Nonlnferior Set Estimation). Este método consiste
en una aplicación iterativa del método de las ponderaciones, con la peculiaridad de que los pesos no se
eligen arbitrariamente, sino que el cociente de sus valores (Wj / W2) es igual a la pendiente de la recta
que conecta los puntos eficientes obtenidos en la iteración anterior. Con este método se puede obtener
una rápida y buena aproximación del conjunto eficiente. Incluso para problemas de tamaño moderado
puede generar una representación exacta del conjunto eficiente.
El único método que garantiza la generación de todos los puntos extremos eficientes es el Simplex
multicriterio. El propósito de este método, inicialmente propuesto por Philip (1972) y Zeleny (1973),
consiste en encontrar todos los puntos extremos eficientes de un problema multicriterio desplazándose
para ello de un punto extremo a un punto extremo adyacente. El algoritmo del simplex tradicional
constituye el mecanismo adecuado para efectuar este tipo de desplazamiento.
Hay software basado en el simplex multicriterio como ADBASE y MLP El primero ha sido
diseñado por el profesor Steuer (1983) de la Universidad de Georgia de Estados Unidos. Trabaja
eficientemente con matrices de 50 x 50 y un número de objetivos en torno a tres. Para tamaños
superiores se vuelve inoperante. MLP se basa en el simplex multicriterio desarrollado por Zeleny y su
principal atractivo es que se puede utilizaren computadores personales, sin embargo, sólo es útil para
abordar pequeños problemas multicriterio.
Por último, hay un problema operativo en todos los métodos multicriterio y que consiste en el
elevado número de puntos eficientes que generan. Este problema de excesiva información puede
paliarse reduciendo el conjunto de puntos eficientes de diversas formas, entre las que se encuentran las
operaciones de poda y filtrado. Con estas técnicas se descartan soluciones eficientes que no son
excesivamente diferentes de otras obtenidas previamente.
478
X
~ BIBLIOTECA
A l g u n a s definiciones
Variable de decisión
Representa algo que está bajo nuestro control y que puede tener impacto sobre la solución del
problema. Amenos que se indique lo contrario, se asume que las variables son no negativas.
Variables desviación
Reflejan la falta (N¡) o el exceso de logro (P¡) de un objetivo i. Todas son no negativas.
Solución factible
Cualquier conjunto de variables decisión y desviación no negativas.
Solución básica
Si (n + 2m) - m variables (decisión o desviación) se hacen cero y se resuelven las m metas, la
solución resultante es una solución básica. Las m variables que no se hacen cero son las variables
básicas y las que se han anulado son las no básicas.
Solución degenerada
Cualquier solución básica en que una o más de las variables básicas vale cero.
Solución implementable
Es una solución posible en la que todas las restricciones rígidas o absolutas se satisfacen. Esto es,
la primera prioridad se logra completamente (ai = 0).
Función de logro
Indica el grado de logro asociado a cada meta. Dada una función que hay que minimizar
lexicográficamente, la función de logro es un vector ordenado.
Solución óptima
En programación por metas con prioridades, la solución óptima es la solución posible asociada
con el vector de logro minimizado.
479
Solución no acotada
Si hemos asociado niveles de aspiración a todos los objetivos, un programa por metas no puede
tener solución ilimitada o solución indeterminada.
La programación por metas está en la línea de la filosofía que propone Herbert Simon (Nobel de
Economía, 1978). Según Simon, el contexto decisional actual está definido por información incompleta,
recursos limitados, multiplicidad de objetivos, conflicto de intereses, etc. En este contexto complejo
muchas veces el que toma las decisiones intenta que una serie de metas relevantes se aproxime lo más
posible a unos niveles de aspiración fijados de antemano.
Según Romero (1993), en los últimos años la programación por metas constituye no sólo el enfoque
multicriterio más profusamente aplicado, sino también uno de los métodos de investigación operativa
de mayor popularidad. Este autor recoge más de 350 referencias bibliográficas de aplicaciones de la
programación por metas aparecidas en la literatura.
480
MODELO GENERAL
r=k i=m
MINW = £ P r Z ( W u d r + W - d : )
r=l i=l
Donde
d~1 d1+
b¡
481
La relación entre d~ y d* :
d" x d+ =
£ £
b;=k
£
b¡= n
iii. Se permite la desviación d* : No se acepta producir por debajo del punto de equilibrio bi = 1.
£
bí=l
En este caso se recomienda colocar ambas desviaciones, las cuales serán controladas con la
función objetivo.
Aplicación
Para fabricar la sustancia A se requiere 1 hora de mano de obra, 2 unidades del compuesto r y 1
hora de empaque. En la producción de la sustancia B se necesitan 3 horas de mano de obra, 1 unidad
482
del compuesto r y 1 hora de empaque. Para mano de obra la compañía tiene 24 horas diarias, se poseen
18 unidades del compuesto r por día y como máximo se tienen 10 horas diarias para empaque.
Se tiene entonces un problema con dos (2) objetivos que tratamos de satisfacer simultáneamente
y que son total o al menos parcialmente conflictivos.
Variables de decisión:
Modelo:
MAX Z = 2 X, + 3 X 2 (Utilidad)
MIN W = 4 X! + 2 X 2 (Contaminación)
Xi + 3X 2 < 24
2X, + X2 * 18
X, + X2 ^ 10
X,, X2 > 0
MIN Y = | 2 X 1 + 3 X 2 - 2 8 | + | 4 X , + 2 X 2 - 2 4 |
X, + 3X 2 < 24
2X, + X2 ^ 18
X, + X2 ^ 10
X,, x 2 > o
i=2
i=l
483
Sujeta a:
X, + 3 X2 < 24
2 X, + X2 < 18
x, + x2 < 10
2 X, + 3 x 2 - d;+ dr= 28
+
4 X, + 2 X 2 - d 2 + d¡ = 24
X], x2, , 5 ?
>— 0
Resolviendo el anterior problema con WINQSB Versión 1.00 Copyright © Yih - Long Chang,
llegamos a las siguientes respuestas:
132 *
Siendo Z = = 26,4 y W = 24. Es decir, para la meta correspondiente al beneficio, hay una
desviación por defecto de 1,6 unidades ( d¡* = 1,6), mientras que la meta correspondiente a contaminación
queda satisfecha.
La Teoría de "Analityc Hierarchy Process" fue desarrollada por Thomas L. Saaty a finales de los
años setenta.
Idea Jerárquica
OBJETIVO GLOBAL
Criterio
484
Alternativas
• Matriz de comparaciones
• Análisis de Inconsistencia
w = 5,03786
^-MAX ~ ^
Coeficiente de Inconsistencia: CI = - — ; CI = 0,0095
n -1
0,0095
Ratio de Inconsistencia: RI = ; RI = ; RI = 0,0085
CIA 1,12
Si RI < 10 %, aceptar; en caso contrario, se deben reestimar algunos o todos los a¡j.
Uno de los paquetes de software utilizados en los Procesos Analíticos Jerárquicos es el Expert
Choice.
485
EJERCICIOS RESUELTOS
I • Un productor de fríjol posee 85 hectáreas de terreno para cultivar dos variedades de fríjol:
Bola Negra y Bola Blanca. La variedad Bola Negra deja un beneficio de 9 6 0 0 0 0 u.m./ha,
necesitándose 3 hor/ha de uso de maquinaria y 80 hor/ha de mano de obra. La variedad Bola
Blanca genera una utilidad de 7 5 0 0 0 0 u.m./ha, se requieren 2 hor/ha de uso de maquinaria y
6 0 hor/ha de mano de obra. La cooperativa local ha asignado 2 1 0 horas de maquinaria y
5 9 0 0 horas de mano de obra.
Supongamos que el Ministerio de Agricultura ha decidido para la cosecha del año que viene,
planificar la producción de cada una de las dos variedades de fríjol. La distribución es asignada
dependiendo del número de hectáreas de cada una de las fincas.
Variables de decisión:
Modelo:
MAX Z = 9 6 0 0 0 0 X + 7 5 0 0 0 0 X2
8 0 X! + 6 0 X2 < 5900
XI + X2 < 85
X!,X2 > 0
486
x2
FIGURA N ° 1
Primero se impone que se dedique al cultivo de Bola Blanca al menos 4 5 hectáreas, por tanto la
meta es: x 2 ^ 4 5 , que se transforma en x 2 + ni - pi = 4 5 , la función de realización
correspondiente a este primer nivel de prioridad sería: hi(ni, pi) = n^
Segundo, impone que la variedad Bola Negra no puede superar las 3 0 hectáreas, luego
xi < 3 0 , entonces, xi + n 2 - p 2 = 3 0 y h 2 (n 2 , p 2 ) = p 2 .
LEXMIN ( n l í P 2 )
Sujeta a:
3 Xt + 2 X2 < 210
8 0 Xt + 6 0 X2 < 5900
X, + X2 < 85
X2 + ni - pi = 45
XT + n2 - p2 = 30
X u X 2 , n u n 2 , pi, p 2 > 0
N i v e l 1:
M I N n.
Sujeta a:
487
3X, + 2X2 210
8 0 X, + 6 0 X2 ^ 5900
Xt + X2 ^ 85
X 2 + nn - p! = 45
XT, X 2 , n , , pi > 0
LP O P T I M U M F O U N D AT STEP 0
OBJECTIVE F U N C T I O N VALUE
1)0
N O . ITERATIONS^ 0
Gráficamente:
X2
FIGURA N° 11
488
N i v e l 2:
M I N p2
Sujeta a:
3 X, + 2 X2 < 210
8 0 X, + 6 0 X2 < 5900
Xi + X2 < 85
x 2 + ni - P! = 45
r>i = 0
Xi + n2 P2 = 30
LP O P T I M U M F O U N D AT STEP 0
1)0
P2 0.000000 1.000000
X 0.000000 .000000
,
X2 85.000000 .000000
P1 40.000000 .000000
N2 30.000000 .000000
N O . ITERATIONS= 0
De esta forma el agricultor dedica las 85 hectáreas a la variedad de Bola Blanca superando la
meta en 4 0 hectáreas y no produce variedad Bola Negra. Con esta combinación satisface las
metas impuestas por el Ministerio.
489
x2
9
Una compañía aérea tiene dos clases de aviones, Boeing 7 5 7 y Airbus 3 3 0 para cubrir un
determinado trayecto. Los Boeing deben hacer más veces el trayecto que los Airbus, pero los
Boeing no pueden sobrepasar los 120 viajes. Entre los dos tipos de aviones deben hacer más de
6 0 vuelos, pero menos de 2 0 0 vuelos. En cada viaje de los Boeing la compañía gana 3 0 0 0 0 0
u. m. y en cada uno de los Airbus 2 0 0 0 0 0 u. m.
Tras un estudio, la compañía ha estimado que en cada vuelo de los Boeing se consumen 9 0 0
litros de combustible y en cada vuelo de los Airbus se consumen 9 0 0 litros. Si se desea seguir
maximizando los beneficios y a la vez minimizar el consumo de combustible. ¿Cuál sería el
problema resultante? ¿Explique brevemente con qué tipo de técnicas lo resolvería?
Variables reales:
Modelo:
MAX Z = 3 0 0 0 0 0 X, + 2 0 0 0 0 0 X 2
M I N W = 9 0 0 X] + 7 0 0 X 2
Sujeta a:
X, > X2
X] — 120
6 0 < Xt + X 2 < 200
XI, X2 > 0
490
Donde f, (X 1; X2) = 3 0 0 0 0 0 X, + 2 0 0 0 0 0 X 2 corresponde a la función de beneficios y f 2 (X 1f X2)
= 9 0 0 XT + 7 0 0 X 2 corresponde al gasto en combustible. Gráficamente el conjunto de
oportunidades es:
X2
FIGURA N°4
Los óptimos individuales corresponden a los vértices (120, 80) y (30, 30): gráficamente, para la
primera función:
FIGURA N° 11
491
Y para la segunda:
X2
FIGURA N ° 6
La matriz de pagos, tras evaluar los óptimos individuales en cada uno de los objetivos,
corresponde a:
f. -f2
X* =(120, 80) 52000000 - 164000
x ; = (30, 30) 15000000 - 48000
Se ha considerado - f 2 para tener los dos objetivos bajo máximo. Una vez determinada la matriz
de pago obtenemos el rango de variación de las correspondientes funciones.
Para resolver el problema podríamos utilizar la programación por metas, debiendo imponer
niveles de prioridad y metas sobre el planteamiento del problema.
Para ello, supongamos que: la empresa cuenta tan sólo con 7 5 0 0 0 litros de combustible y
estima unos costes de 2 4 millones que es evidente que desea cubrirlos. Con esta información
del problema podemos construir las metas y determinar las funciones de realización.
9 0 0 Xt + 7 0 0 X 2 < 7 5 0 0 0
492
t?; Oí
? BIBLIOTECA
NIIPté
Entonces 9 0 0 X, + 7 0 0 X2 + n, - p, = 7 5 0 0 0 y h ^ n , , pi) = pi
Como queremos cubrir los costos, los beneficios deberán de ser superiores. Luego: 3 0 0 0 0 0 Xi
+ 2 0 0 0 0 0 X2 > 2 4 0 0 0 0 0 0 y la meta:
3 0 0 0 0 0 X, + 2 0 0 0 0 0 X2 + n 2 - p 2 = 2 4 0 0 0 0 0 0
La función de realización h 2 (n 2 , p 2 ) = n 2 .
LEX M I N ( p l , n2)
-X, + X2 < 0
<
Xi 120
>
X, + X2 < 60
X ] + X2 200
9 0 0 X1 + 7 0 0 X2 + n-| - p, 75000
3 0 0 0 0 0 X, + 2 0 0 0 0 0 X 2 + n2 - p2 = 24000000
X 1f X 2 , n 1 ( n 2 , pi, p 2 > 0
N i v e l 1:
M I N p.
Sujeta a:
- X, + X2 < o
<
Xi 120
>
X, + X2 < 60
X, + x 2 200
9 0 0 X, + 7 0 0 X2 + n, - p, = 75000
LP O P T I M U M F O U N D AT STEP 2
OBJECTIVE F U N C T I O N VALUE
1) 0.000000
493
VARIABLE VALUE REDUCED COST
P1 0.000000 1.000000
X 30.000000 .000000
i
2 X 30.000000 .000000
NI 27.000000 .000000
N O . ITERATIONS = 2
X2
FIGURA N ° 7
N i v e l 2:
M I N n2
- X, + X2 < 0
Xi < 120
Xi + X2 > 60
Xi + X2 < 200
9 0 0 X, + 7 0 0 X2 + n, - P! = 75000
Pi = 0
3 0 0 0 0 0 Xi + 2 0 0 0 0 0 X2 + n2 - p2 = 24000000
X l 7 X 2 , n l 7 n 2 , pi, p 2 > 0
494
LP O P T I M U M F O U N D AT STEP 2
OBJECTIVE F U N C T I O N VALUE
1) 0.000000000
N O . ITERATIONS= 2
De acuerdo al resultado, la compañía debe realizar 8 0 vuelos con los aviones Boeing y ninguno
con los Airbus.
X2
FIGURA N ° 8
495
a. Por cada cinco horas de estudio obtiene un punto en la parte estudiada.
b. Cada parte, la teórica y la práctica, vale 12 puntos.
c. Debe obtener al menos cinco puntos en el teórico y en el práctico para tener lugar a cómputo.
d. Se aprueba con una media, entre teórico y práctico de 7 puntos.
e. No se puede estudiar más de 16 horas al día.
Formule el modelo que le determine el número de horas de estudio de cada uno de los temas,
en cada una de sus partes, teórica y práctica si desea.
Variables reales:
Modelos:
M I N n.
< 12
< 12
Xi + X2 + X3 + X4 + X5 + X6 < 80
1
+ ~ X6 + n, - p! 75000
a a a 0
1, X2/2 , X3,3 , X4,4 , X 5 , X ó , n 1 ( pi
Xi, >
496
Segundo Nivel de Prioridad:
M I N n2
1 1 1
gX] + - X3 + - x5 < 12
1
v 1 1
5X2 + 5 X4 + - X6 < 12
Xi + X2 + X3 + X4 + X5 + Xó < 80
1
5 xv2 + -1 vx 4 + 1- x6 + m - p, = 5
ni 0
1 1
1 X
5 i + g X3 + — X5 + n2 - p2 = 4
MIN p3
¡X2 + 1 x4 + ¡
Xi + x2 + x3 + x4 + x5 + x6
1 1
1 Y 2 + V
5 5 4
+ g X6 + n, - pi
ni
1
1 YAl + 5l vX3 + - X5 + n2 - p2
5
n
2
Xi + X2 + X3 + X4 + X5 + Xó + n3 p3
Xi, X2, X3, X4, X5, X6, ni, n2, n3, pi, p2, p3
Cuarto Nivel de Prioridad:
M I N n4
1 1 1
gX, + - x 3 + - x 5 < 12
1 X
-
1+ - X 1 + - X6 ¿ 1 2
2 4
X! + X 2 + X3 + X4 + X5 + X6 ^ 80
1 1 1
5Xl +
5*3 +
5Xs * 5
1 1 1
-X 2 + - X4 + - X6 > 5
1
-X + -
1 X + -
1 X + ni - Pi =
2 4 ó ni = 05
1 1 1
- Xi + — X3 + — X5 + n2 - p2 = 4
n2 = 0
Xi + X 2 + X3 + X4 + X5 + X6 + n3 - p3 = 40
1 1 1 1 1 1
v „ Xi + —— X 2 + —— X 3 + , — X4 + —— X5 + —— XA + n4 - p4 = 7
10 10 10 10 10 10
X
l/ X2/ X3/ X4, X5/ X6/ n l/ n2/ n 3 / n4/ Plí P2/ P3/ P4 ^ 0
4
Una empresa produce dos artículos, A y B, cuyos precios de venta en el mercado son de
6 u. m. y 9 u. m. respectivamente. Los recursos utilizados en la fabricación de A y B y sus
consumos, por unidad, están dados en la siguiente tabla:
498
El gerente de la empresa establece un conjunto de metas con el siguiente orden de importancia:
Definición d e v a r i a b l e s :
Modelo:
MAX Z = 6 XA + 9 XB
X, + 3X2 < 24
2 X, + X2 ^ 18
Xt + X2 10
XlfX2 > 0
X.
FIGURA N° 11
499
Respecto a las metas del problema, primero se impone que el coste total de los recursos no debe
superar el presupuesto disponible que es de 52 u. m. El costo que supone producir una unidad
de A se corresponde con 1 + 2 + 2 u. m., es decir, 5 u. m. y el costo que supone una unidad de
B asciende a 3 + 1 + 2 u. m., es decir, 6 u. m. Por tanto esta primera meta resulta 5XT + 6x 2 <
5 2 , es decir, 5x] + óx 2 + ni - p 1 = 5 2 , siendo la función de realización, h](ni, pi) = pi.
Segundo, impone que los ingresos por venta han de ser como mínimo de 6 0 u. m., luego 6x1 +
9x2 ^ 6 0 , entonces, 6x1 + 9x2 + n 2 - P2 — 6 0 y h2(n2, P2) = n 2 .
En tercer lugar, se desea satisfacer, como mínimo, la demanda. Puesto que se estima que para
A es, al menos, de 2, y, para el tipo B, es, al menos, de 5, las dos con igual importancia, en este
nivel de prioridad existen dos metas, la primera Xi > 2, entonces, xi + n 3 - p 3 = 2 y la segunda
X2 ^ 5, entonces, X2 + n 4 - p 4 = 5 siendo la función de realización de este nivel h 3 (n 3 , p 3 , n 4 , p 4 )
= n3 + n4.
LEXMIN (p 1( n 2 , n 3 + n 4 )
X] + 3X2 < 24
2 X, + X2 < 18
Xi + x2 < 10
5 X] + 6 X2 + ni - Pi = 52
6 Xt + 9 X2 + n2 - p2 = 60
Xi + n3 - p3 = 2
X2 + n4 P 4 = 5
X, , X 2 , n 1 ( n 2 , n 3 , n 3 , p 1 ( p 2 , p 3 , P4 > 0
Nivel 1:
M I N p!
Sujeta a:
XT + 3X 2 < 24
2 X] + X2 < 18
Xt + X2 < 10
5 X] + 6 X2 + ni - pi = 52
X i , X 2 , n^, pi > 0
Aplicando el programa LINDO Release 9 . 0 para Programación Lineal obtenemos:
OBJECTIVE F U N C T I O N VALUE
1) 0 . 0 0 0 0 0 0 0 E + 0 0
Gráficamente:
X2
F I G U R A N ° 10
Nivel 2:
M I N n2
C o n sus restrcciones:
X, + 3X2 24
2 X, + X2 18
501
Xt + X2 < 10
5 Xt + 6 X2 + ri! - Pi 52
Pi 0
6 X] + 9 X2 +n 2 - p2 60
Xi, X2, n n , n 2 , p], p 2 > 0
LP O P T I M U M F O U N D AT STEP 1
OBJECTIVE F U N C T I O N VALUE
1) 0 . 0 0 0 0 0 0 0 E + 0 0
Gráficamente:
X2
FIGURA N° 11
502
Nivel 3:
M I N n3 + n4
X! + 3 X2 < 24
2Xi + X2 < 18
Xi + x2 < 10
5 X, + 6 X2 + ni - Pi = 52
Pi = 0
6 Xi + 9 X2 + n2 - p2 = 60
n2 = 0
XI + n3 - p3 = 2
X2 + n4 - p4 = 5
Xi , X 2 , ni , n 2 , n 3 , n 4 , p!, p 2 , p 3 , p 4 > 0
LP O P T I M U M F O U N D AT STEP 1
OBJECTIVE F U N C T I O N VALUE
1) O.OOOOOOOE + OO
Así pues, puesto que el valor de la función objetivo es cero, existen soluciones satisfactorias, y
de esta forma, la empresa debe producir 2 unidades del primer producto y 5 , 3 3 3 3 unidades de
B. Con esta combinación satisface todos los deseos del gerente.
503
x2
F I G U R A N ° 12
b. Si la máxima ganancia se alcanza en el punto (100, 450) y por otra parte el mínimo de
consumo de energía en (100, 250), elabore la matriz de pagos.
d. ¿Qué se entiende por solución satisfactoria? Indique alguna técnica para su obtención.
V a r i a b l e s d e decisión:
Modelo:
MAX Z = 2 X, + 1,4 X2
504
MIN W = X I + X2
6 X, + 4 X2 < 2400
Xt > 100
X2 > 250
X l f X2 > 0
X2
Los objetivos de la empresa son, por un lado, maximizar las ganancias de la empresa y, por
otro, minimizar el consumo de energía. Así pues, los objetivos son:
MAX Z = 2 X, + 1,4 X 2
M I N W = Xt + X 2
Por tanto, el problema multiobjetivo que permite el plan de producción que maximiza las ganancias
de la empresa y minimiza el consumo de energía es el siguiente:
MAX Z = 2 X, + 1,4 X 2
M I N W = X, + X 2
Sujeta a:
6 X, + 4 X2 < 2400
Xi > 100
x2 > 250
Xi , X2 > 0
505
Para la obtención de los óptimos individuales, tendríamos que resolver dos problemas
correspondientes a:
1. Beneficios
AAAXZ(X 1 ,X 2 ) = 2 X , + 1,4 X 2
ó X] + 4 X2 < 2400
Xt > 100
X2 > 250
Xlf X2 > 0
2. Energía
M I N W (X,,X 2 ) = Xt + X 2
Sujeta a:
X2
FIGURA N ° 1 4
506
"2
X,
100 200 300
FIGURA N ° 1 5
b. La matriz de pagos, tras evaluar los óptimos individuales en el otro objetivo nos quedaría:
f, = Z - f2 = - W
x; = ( 1 0 0 , 4 5 0 ) 830 - 650
x ; = (100, 250) 550 - 350
FIGURA N° 16
507
d. Una solución satisfactoria es un punto que verifica las restricciones originales del problema
y además las metas impuestas por el decisor, en el caso de que este haya impuesto niveles de
aspiración a los objetivos del problema. La técnica que encuentra soluciones satisfactorias se
denomina Programación por Metas.
EJERCICIOS PROPUESTOS
I • Un impresor desea planificar el trabajo de la próxima semana para lo cual tiene ofertas de
trabajo muy superiores a sus posibilidades de realización, por lo que debe decidir el número y tipos de
trabajos, trabajo tipo A, encuademación de volúmenes, tipo B, picado, impresión y encuademación de
textos y tipo C, diseño gráfico e impresión de pósters, almanaques. Sabiendo que los tiempos consumidos
por cada tarea como media son los dados por la tabla y que en el taller trabajan tres personas, una en
el computador, otra en la encuademación y otra en la máquina offset, a razón de 5 días a la semana y
8 horas al día, se desea:
a. Formular el modelo maximizando los beneficios y minimizando los trabajos del tipo C.
b. Si en lugar de lo expuesto en el apartado anterior, se plantea cubrir con las utilidades al menos
el sueldo de los trabajadores más los seguros e impuestos, que ascienden a un total de 225000
u. m. y además que el número de horas no ocupadas sea al menos superior al 3% de la
jomada semanal, para la resolución de imprevistos.
508
Proceso 1 Proceso 2 Utilidad Costo Mano de Obra
C, 1 3 3 2
C2 1 4 2 1
C3 1 1 2 1
Máximo disponible (u. m.) 70 80
3
Una empresa se dedica a la fabricación de dos productos, A y B, que se elaboran, tanto en
horas ordinarias como en horas extras de trabajo. Los objetivos económicos que se plantean para el
próximo ejercicio son los siguientes:
Además de estos objetivos, hay que considerar un conjunto de condiciones, las cuales están
relacionadas con la producción mínima requerida para cada tipo de producto, así como con la
disponibilidad de horas de trabajo en tiempo normal y en tiempo extra:
En horas ordinarias de trabajo, cada unidad del producto A necesita 3 horas para su fabricación y
cada unidad del producto B, 2 horas, siendo el tiempo disponible al día de 120 horas.
Por otro lado, si los productos se fabrican en horas extraordinarias, se necesita 1 hora de trabajo
por unidad de producto (tanto en el A como en el B), disponiéndose de un total de 20 horas extras.
Debido a un contrato de suministro con su mejor cliente, la empresa debe fabricar al menos 30 unidades
diarias del producto A, ya sea en tiempo normal como en tiempo extra, imponiendo la misma restricción
al producto B.
509
u. m. y el coste a 3 u. m. para el producto B, el ingreso es de 8 u. m. y el coste de 4 u. m. en jornada
normal y también se reduce a 7 u. m. y 2 u. m. respectivamente, en tiempo extra.
Primer nivel de prioridad: Obtener un ingreso que supere, como mínimo, las 700 u. m. diarias.
Segundo nivel de prioridad: Los costes de la empresa no deben sobrepasar el nivel presupuestado
de 500 u. m. diarias.
Tercer nivel de prioridad: El nivel de producción total, tanto en el tiempo normal como en el
tiempo extra, debe situarse exactamente en las 100 unidades de demanda media diaria estimada.
Se pide:
4 » Una empresa tiene dos fábricas, A y B, que producen el mismo bien en dos regiones de un
mismo país. La producción de una unidad del bien cuesta un euro en ambas fábricas y el presupuesto
disponible para cubrir los costos semanales totales es de 16000 u. m.. El empresario exige que la
diferencia entre la producción del bien en la región Amenos la de la fábrica de la región B sea menor
o igual que 6.000 unidades. La empresa desea:
• Maximizar el beneficio total, siendo el beneficio unitario del bien en las fábricas A y B de 6 u.
m. y 3 u. m., respectivamente.
Minimizar el pago de impuestos a la producción, que es de 0,75 u. m. por cada unidad producida
en la región A y 0,25 u. m. por cada unidad producida en la región B.
b. Suponga que la empresa establece las siguientes metas con el orden secuencial de importancia:
Primer nivel de prioridad: El beneficio total debe ser, como mínimo, de 9.000 u. m..
Segundo nivel de prioridad: El pago de impuestos no debe superar los 2.000 u. m..
510
bl. Construya un modelo de programación por Metas Lexicográficas que responda a los deseos
de la empresa.
b2. Resuelva el problema gráficamente, indicando cuáles son las soluciones satisfactorias del
problema.
b. Suponga que la empresa establece las siguientes metas con su respectivo nivel de importancia:
Segundo nivel de prioridad: La producción total debe ser, como mínimo, de 12 unidades.
Plantee el problema de Programación por Metas Lexicográficas que responda a los deseos de la
empresa e indique el problema a resolver en cada nivel.
511
CAPÍTULO XVII
TEORÍA DE JUEGOS
"Nunca consideres el estudio como una obligación, sino como una oportunidad para penetrar en
el bello y maravilloso mundo del saber". Albert Einstein
INTRODUCCIÓN
La característica principal de los problemas de decisión que se estudian bajo la Teoría de Juegos
reside en el número de decisores que son más de uno y tienen intereses contrapuestos, por lo que
estamos en un ambiente de conflicto; un juego de estrategia tiene, por tanto, más de un decisor y los
resultados de cada jugador no sólo dependen de sus acciones, sino también de las acciones seguidas
por el resto de los decisores. La Teoría de Juegos se debe básicamente a John von Neumann y Oscar
Morgenstern; actualmente tiene muchas aplicaciones, sin embargo, la economía es el principal cliente
para las ideas producidas por los especialistas en Teoría de Juego. Entre las disciplinas donde hay
aplicación de la Teoría de Juegos tenemos:
En la Economía
No debería sorprender que la Teoría de Juegos haya encontrado aplicaciones directas en economía.
Esta ciencia se supone que se ocupa de la distribución de los recursos escasos. Si los recursos son
escasos es porque hay más gente que los quiere, de la que puede llegar a tenerlos.
Este panorama proporciona todos los ingredientes necesarios para un juego. Además, los
economistas neoclásicos adoptaron el supuesto de que la gente actuará racionalmente en este juego.
En un sentido, por tanto, la economía neoclásica no es sino una rama de la Teoría de Juegos.
Los economistas que no se dan cuenta de ello son como el monsieur Jourdain de Le Bourgeois
Gentilhomme, de Moliere, que se sorprendió de saber que había estado hablando en prosa durante toda
la vida sin saberlo. Sin embargo, aunque los economistas pueden haber sido desde siempre especialistas
camuflados en Teoría de Juegos, no podían progresar por el hecho de no tener acceso a los instrumentos
proporcionados por Von Neumann y Morgenstern. En consecuencia, sólo podían analizar juegos
particularmente simples. Esto explica por qué el monopolio y la competencia perfecta se entienden
bien, mientras a todas las demás variedades de competencia imperfecta que se dan entre estos dos
extremos sólo ahora se les está empezando a dar el tratamiento detallado que merecen.
La razón por la que el monopolio es simple desde el punto de vista de la Teoría de Juegos es que
puede ser tratado como un juego con un único jugador, porque como la competencia perfecta es simple
es que el número de jugadores es de hecho infinito, de manera que cada agente individual no puede
tener un efecto sobre agregados de mercado si él o ella actúa individualmente.
513
En la Ciencia Política
La Teoría de Juegos no ha tenido el mismo impacto en la ciencia política que en economía. Tal vez
esto se deba a que la gente conduce menos racionalmente cuando lo que está enjuego son ideas, que
cuando lo que está enjuego es su dinero. Sin embargo, se ha convertido en un instrumento importante
para clarificar la lógica subyacente de un cierto número de problemas más paradigmáticos.
La elección de programa: Hay dos partidos, los Formalistas y los Idealistas. Ninguno de los dos se
preocupa en absoluto por cuestiones de principio. Sólo se preocupan por el poder y, por tanto, eligen el
programa con el único objetivo de maximizar el voto en las próximas elecciones. Los votantes, por otra
parte, sólo se preocupan por cuestiones de principio y, por ende, carecen por completo de fidelidad a los
partidos.
Para simplificar, las opiniones que un votante puede tener se identifican con los números reales en
el intervalo (0, 1), en otras palabras, el conjunto de valores de X que satisfacen 0 menor igual a X
menor igual a 1. Podemos imaginarnos que este intervalo representa el espectro político de izquierda a
derecha. Así, alguien con la opinión X = 0, se cree que la sociedad debería estar organizada como un
hormiguero, mientras que alguien en la opinión X = 1 cree que debería estar organizada como una
piscina llena de tiburones.
Cada partido centra su programa en algún punto del espectro político y no puede cambiar su
posición posteriormente. Los electores votan por el partido que se encuentra más cerca de su posición.
Dado que se supone que los votantes se encuentran distribuidos uniformemente sobre el espectro
político, es decir, que una fracción 1 de la población sostiene opiniones que se encuentran en cualquier
intervalo de longitud 1, es fácil ver cuántos votos conseguirá cada partido una vez que han elegido
programa. El secreto está en buscar el votante mediano entre aquellos cuyas opiniones se encuentran
entre los programas de ambos partidos.
El votante mediano se encuentra a medio partido entre las posiciones políticas de los dos partidos.
Luego, los que se encuentran a la derecha del mediano votante votarán por un partido y los que se
encuentran a la izquierda lo harán por el otro. Supongamos que los partidos bajan al ruedo político uno
a uno. Los Idealistas escogen en primer lugar, y luego lo hacen los Formalistas. ¿Dónde debería colocarse
cada uno? Problemas como éste pueden ser resueltos por inducción hacia atrás. Para cada programa
posible X, los Idealistas se preguntan qué ocurriría si se colocaran en X. Si X es menor a 1/2 los
Formalistas responderían colocándose inmediatamente a la derecha de X. Entonces los Idealistas
recogerían una fracción X de los votantes y los Formalistas recogerían 1 - X. Por tanto, los Idealistas
ganarían menos de la mitad del voto. Lo mismo ocurre si los Idealistas se sitúan en X menor a 1/2,
excepto que ahora los Formalistas responderán colocándose inmediatamente a su izquierda. Por tanto,
lo mejor para los Idealistas es colocarse en el centro del espectro político.
Los Formalistas también se colocarán en X = 112 y el voto se dividirá mitad y mitad. Este modelo
puede tener sentido en la escena política americana. Ciertamente es difícil para muchos europeos
encontrar diferencias significativas entre Demócratas y Republicanos. El modelo, sin embargo, tiene
poco parecido con la escena política europea. ¿Deberían los americanos deducir, por tanto, que los
514
partidos políticos europeos de verdad se toman en serio los principios que hacen suyos? Una conclusión
así sería prematura porque es dudoso que la situación europea pueda ser razonablemente analizada con
un modelo de dos partidos, y esto es cierto incluso para un país como Gran Bretaña en el que sólo dos
de los partidos consiguen un número importante de votos en la mayoría de elecciones. Para explorar
esta cuestión veamos cómo cambiarían las cosas si tuviéramos que tomar en consideración un tercer
partido.
En este modelo, el partido Institucionalista escoge programa después de los Idealistas y Formalistas.
Esto cambia mucho las cosas.
Los Idealistas y los Formalistas ciertamente no se colocarán ahora en el centro del espectro
político. Si lo hicieran los Institucionalistas se podrían ubicar inmediatamente a su derecha o a su
izquierda. Entonces recogerían la mitad del voto dejando que los primeros partidos se dividan la otra
mitad. Un razonamiento por inducción hacia atrás, algunas sutilezas surgen debido al hecho que
disponemos de un número infinito de opiniones políticas, lo cual hace ver que los Idealistas y los Formalistas
se colocarán en X = 1/4 y X = 3/4, dejando que los Institucionalistas adopten la posición centrista X =
1/2. Los primeros partidos recibirán entonces 3/8 de los votos cada uno y los Institucionalistas sólo
recogerán 1/4.
Pero ¿por qué querrían los Institucionalistas entrar en la arena política si están condenados al
papel de Cenicienta, con los primeros partidos en el papel de Hermanas Feas? Modifiquemos por tanto
el modelo, de manera que los Instuticionalistas consideren que vale la pena formar un partido sólo si
pueden prever que recibirán más del 26% de los votos.
En este caso, los Idealistas se moverán un poco hacia el centro, aunque no lo bastante como para
que los Institucionalistas puedan entrar flanqueándolos por la izquierda. Por tanto, sólo se moverán
desde X = 0,25 a X = 0,26. Análogamente, los Formalistas se moverán desde X = 0,75 a X = 0,74. En
esta elección, los Idealistas y los Formalistas se dividen el voto a partes iguales y los Institucionalistas
se quedan fuera.
Como Sherlock Holmes explicaba, a menudo lo importante es que el perro no ladró aquella noche.
En la B i o l o g í a
Es imposible igualar el entusiasmo con que los biólogos evolucionistas que usan la Teoría de
Juegos explican de conducta animal. No sé si escogen historias poco delicadas deliberadamente, para
dar un poco de sabor a sus relatos con implicaciones sexuales, o si éstos son realmente los mejores
ejemplos para ilustrar de qué manera la Teoría de Juegos es relevante. En cualquier caso, lo que los
biólogos dicen sobre el pez sol es esto.
515
Hay dos clases de machos en esta especie. El primero es un individuo regularmente hogareño
que necesita siete años para alcanzar la madurez. Una vez alcanzada, construye un nido que atrae a las
hembras que ponen huevos. Cuando los huevos han sido puestos, no sólo los fertiliza, sino que defiende
la familia resultante lo mejor que puede, mientras la hembra continúa su vida independientemente. La
otra clase de macho es un pillo.
Por lo que dicen los biólogos, es poco más que un órgano sexual autopropulsado. Este posee
ventaja sobre los machos normales, que consiste en alcanzar la madurez en sólo dos años. Sin embargo,
es incapaz de responsabilizarse por su familia. En lugar de ello, espera escondido hasta que una hembra
que ha puesto sus huevos respondiendo a las señales de un macho normal tenga la oportunidad de
hacerlo. Si el pillo tiene éxito, el macho normal defiende una familia que no está relacionada con él en
absoluto y que lleva por el contrario los genes del pillo.
La Teoría de Juegos sirve para explicar por qué las dos clases de machos pueden coexistir en
proporciones fijas. Para que una historia de Teoría de Juegos se aguante en este contexto, necesitamos
una explicación de cómo los genes se distribuyeron exactamente en la forma necesaria para asegurar
a cada pez optimizarla, dada la mezcla actual en la población de hogareños pillos.
No basta con decir que la naturaleza, "con las garras y las fauces llenas de sangre", actuará de
forma que sólo quienes se adaptan sobreviven. Esta respuesta rehuye el problema de cómo y por qué
resulta que a veces adaptarse implica actuar racionalmente. Esta parece ser una de esas grandes
cuestiones que no tienen respuestas fáciles.
En la Filosofía
Los especialistas en Teoría de Juegos creen que pueden demostrar formalmente por qué incluso
el individuo más egoísta puede descubrir que con frecuencia, cooperar con sus vecinos en una relación
a largo plazo redundará en su propio interés ilustrado. Con este fin estudian los equilibrios de juegos con
repetición -juegos que los mismos jugadores juegan una y otra vez-. Pocas cosas han descubierto en
esta área hasta el presente que hubieran sorprendido a David Hume, quien hace ya unos doscientos
años articuló los mecanismos esenciales. Estas ideas, sin embargo, están ahora firmemente basadas en
modelos formales. Para avanzar más, habrá que esperar progresos en el problema de la selección de
equilibrios en juegos con múltiples equilibrios.
Cuando estos progresos se den, sospecho que la filosofía social sin Teoría de Juegos será algo
inconcebible y que David Hume será universalmente considerado como su verdadero fundador.
El Filósofo Hobbes dijo que un hombre se caracteriza por su fortaleza física, sus pasiones, su
experiencia y su razón.
Fortaleza Física: ésta determina lo que alguien puede o no puede hacer. Un atleta puede planear
correr una milla en cuatro minutos, pero sería imposible para la mayoría ejecutar este plan. La Teoría
de Juegos incorpora estas consideraciones en las reglas del juego. Ellas señalan lo que es factible para
516
un jugador. Más exactamente, un jugador queda limitado a escoger en el conjunto de sus estrategias en
el juego.
Razón: En problemas de decisión unipersonales, los economistas simplemente suponen que los
jugadores maximizan sus pagos esperados dadas sus creencias. En un juego las cosas son más
complicadas, porque la idea de equilibrio da por supuesto que los jugadores saben algo acerca de cómo
razona todo el mundo.
La noción de equilibrio es fundamental para la Teoría de Juegos. Pero por qué anticipamos que
los jugadores usarán estrategias de equilibrio. Dos tipos de respuestas hay, en primer lugar del tipo
educativo, éstos suponen que los jugadores tengan al equilibrio como el resultado de razonar
cuidadosamente. No se acepte ante frases que empiezan "si yo pienso que él piensa que yo pienso ...",
por lo contrario, los jugadores proseguirían con razonamiento así hasta el final, por difícil que fuera.
Sin embargo, la respuesta educativa no es la única posible. También hay respuestas evolutivas.
Según éstas, el equilibrio se consigue, no porque los jugadores piensan todo de antemano, sino como
consecuencia de que los jugadores miopes ajustan su conducta por tanteo cuando juegan y se repiten
durante largos períodos de tiempo.
En un juego finito de dos jugadores, ningún jugador sabe con seguridad que estrategia pura,
incluso si el oponente mezcla, el resultado final será que se juega alguna estrategia pura, la cual terminará
por utilizar el oponente. Un jugador bayesiano-racional, por tanto, asigna una probabilidad subjetiva a
cada una de las alternativas posibles. Entonces el jugador escoge una estrategia que maximiza su pago
esperado con respecto a estas probabilidades subjetivas.
Por tanto, él o ella se comportan como si estuviera escogiendo una respuesta óptima a una de las
estrategias mixtas del oponente, si la estrategia mixta para la que se elige una respuesta óptima.
La Teoría de Juegos da por supuesto que las creencias de un jugador sobre lo que un oponente
hará depende de lo que el jugador sabe acerca del oponente. Sin embargo, no está ni mucho menos
claro lo que debemos suponer acerca de lo que los jugadores saben de su oponente. La idea de racionalidad
517
se construye sobre la hipótesis de que por lo menos debería ser conocimiento común que ambos
jugadores son bayesianos-racionales.
La descripción de un estado, por tanto, debe especificar cada detalle del "mundo posible" que
representa. Esto incluye no sólo cómo se comportan los jugadores, sino también cuáles son sus estados
mentales. Ya que los jugadores son bayesianos-racionales, sus estados mentales se pueden resumir en
dos cosas:
Los bayesianos ingenuos piensan que no es necesario preguntarse de dónde salen las probabilidades
a priori de los jugadores, o cómo saben éstos cuáles son sus particiones de posibilidades, en particular,
creen que la racionalidad bayesiana dota a quienes la hacen suya con la capacidad de coger del aire
sus creencias subjetivas.
Esta actitud lleva a bayesianos que son muy ingenuos a argumentar que la Teoría de Juegos es
una pérdida de tiempo. Es indudablemente cierto que si no necesitáramos preocuparnos de por qué la
gente cree en lo que cree, entonces las consideraciones sobre equilibrios se harían irrelevantes.
Comentarios Generales
Durante las dos décadas que siguieron a la segunda guerra mundial, uno de los progresos más
interesantes de la teoría económica fue la Teoría de los Juegos y el comportamiento económico, publicada
en un libro de este título bajo la autoridad conjunta de Jhon Von Neumann y Oskar Morgenstern.
Actualmente, el consenso parece ser que la Teoría de los Juegos es más relevante al estudio de
problemas comerciales específicos que a la teoría económica general, porque representa un enfoque
único al análisis de las decisiones comerciales en condiciones de intereses competitivos y conflictivos.
El principal objetivo de la Teoría de los Juegos es determinar los papeles de conducta racional en
situaciones de "juego" en las que los resultados son condicionales a las acciones de jugadores
interdependientes. Un juego es cualquier situación en la cual compiten dos o más jugadores. El ajedrez
y el poker son buenos ejemplos, pero también lo son el duopolio y el oligopolio en los negocios. La
extensión con que un jugador alcanza sus objetivos en un juego depende del azar, de sus recursos
físicos y mentales y de los de sus rivales, de las reglas del juego y de los cursos de acciones que siguen
518
los jugadores individuales, es decir, sus estrategias. Una estrategia es una especificación de la acción
que ha de emprender un jugador en cada contingencia posible del juego.
Se supone que, en un juego, todos los jugadores son racionales, inteligentes y están bien informados.
En particular, se supone que cada jugador conoce todo el conjunto de estrategias existentes, no sólo
para él, sino también para sus rivales, y que cada jugador conoce los resultados de todas las combinaciones
posibles de las estrategias.
Igualmente, en una gran variedad de juegos, el resultado es una variable aleatoria cuya distribución
de probabilidades debe ser establecida para que pueda ser posible una solución para el juego. A este
respecto, debe observarse que las decisiones de los jugadores interdependientes no se toman en un
vacío y que los pagos resultantes de estas decisiones dependen de las acciones emprendidas por todos
los jugadores. Esta interdependencia implica que puede ser inapropiado suponer que los pagos están
siendo generados por un proceso probabilista invariante que no es afectado por el curso de acción que
uno escoja. En otras palabras, la acción que emprende un jugador puede dictar los actos de otros
jugadores o influir en la probabilidad de que se comporten en una forma particular. Esta potencialidad
de posibles efectos en los resultados es la que distingue la toma de decisiones en conflictos y la toma de
decisiones en un medio incierto.
La clase más sencilla de modelo de juego rigurosamente adversario, en el que los resultados
posibles son calificados en orden opuesto por los jugadores.
Entre esta clase, el más común es el juego de suma constante, en el que la suma de las ganancias
de los jugadores es igual, cualesquiera que sea su distribución entre ellos. Un caso especial y el único
que consideraremos de juegos de suma constante, se llama juego de suma cero de dos personas.
Dos compañías de autobuses, Ay B, explotan la misma ruta entre dos ciudades y están enfrascadas
en una lucha por una mayor parte del mercado. Puesto que la parte total del mercado es un 100 por 100
fijo, cada punto porcentual ganado por uno debe ser perdido por el otro. Se dice que tal situación es un
juego de suma cero de dos personas por las razones obvias de que el juego es jugado por dos jugadores
diametralmente opuestos y que la suma de las ganancias y pérdidas es siempre cero.
Si se supone que la compañía A y la compañía B están considerando las tres mismas estrategias
para ganar una mayor parte relativa del mercado, como sigue:
Por comodidad, se supone que antes de comenzar el juego ambas compañías no están haciendo
ningún esfuerzo especial y comparten por igual el mercado 50% cada una. Además, si se supone
también que cada compañía no puede emplear más de estas actitudes o estrategias al mismo tiempo y
que las tres estrategias tienen idénticos costos.
519
Por estos supuestos, hay un total de 3 x 3 = 9 combinaciones posibles de movimientos y cada una
es capaz de afectar a la parte del mercado en una forma específica. Por ejemplo, si A y B sirven
refrescos durante el viaje, se dice que A perdería 10% de la parte del mercado a favor de B, lo que
puede indicar que los refrescos de B son más para los gustos de los clientes, igualmente, si A anuncia
y B, por ejemplo, sirve refrescos, se supone que A ganaría 20% del mercado en perjuicio de B;
evidentemente, la publicidad en televisión parece ser más eficaz que servir refrescos. Ahora, por cada
una de las 9 combinaciones puede determinar ganancias o pérdidas del mercado para A.
Estrategias m a x i m í n y m i n i m a x
Obsérvese que los valores de seguridad para los distintos movimientos que puede hacer A son los
mínimos de filas. Dados estos valores mínimos, hará bien en emplear aquella estrategia que da el
máximo de estos valores de seguridad mínimos. En el ejemplo A debe adoptar a2 y aspira a un pago de
- 8 a B. Esta regla de decisión, que conduce a la elección del mayor de los valores mínimos en que
puede resultan cada estrategia, se llama estrategia maximín.
La compañía B, según esta actitud conservadora, supondría que por cada una de sus acciones, la
respuesta de A será tal que la ganancia de A en parte del mercado es la máxima posible. Por ejemplo,
si B emplea la estrategia bl, supondría que A adoptará la estrategia a3, la cual dará la peor pérdida
posible para B. Análogamente, los peores pagos para b2 y b3 son - 8 y -1, los máximos valores en las
columnas 2 y 3, respectivamente. Así, vemos que el máximo en cada columna es el peor pago por un
movimiento correspondiente hecho por B. El mejor de estos peores pagos es claramente el valor
mínimo de estas cifras más altas. Esta cifra - 8 en la columna 2, correspondiente a la estrategia b2 y el
movimiento contrario a2. Por tanto, la emisión óptima, llamada estrategia minimax de B, es b2.
520
Similarmente, se puede argumentar que B debe adoptar b2 por lo que A podría perder 10% o 13%
del mercado a favor de B, a expensas de A. Sin embargo, este pago sólo es posible si A hace el
movimiento de a3.
En otras palabras, las estrategias maximín y minimax conducen a los dos participantes del juego
a situaciones en las que ningún jugador tiene razón o incentivo alguno para cambiar su posición. A no
desea cambiar porque cuando B juega b2, él se encuentra mejor jugando a2 que al o a3. B no desea
cambiar porque cuando A juega a2 se encuentra mejor jugando b2 que bl o b3.
El pago en tal punto de equilibrio es la solución minimax y se conoce como punto de silla de
montar de la matriz de pagos en el sentido de que es el mínimo de sus datos de columna. Consideremos
la solución del par de decisiones en nuestro ejemplo a2 y b2. Cuando A adopte a2 el pago se reduce de
9 a - 8 y luego aumenta de - 8 a - 6. Cuando B escoge b2, su pago disminuye de - 11 a - 8 y luego
aumenta de - 8 a - 10. El número - 8 en medio forma un valle cuando es visto desde la segunda fila,
forma una cordillera cuando es visto desde la segunda columna. La solución minimax semeja
exactamente una silla de montar: de ahí el nombre de "punto en silla de montar", que es a la vez un
mínimo, como un valle máximo, como una cordillera.
Es posible que pueda haber más de un punto en silla de montar en la matriz de pagos de un juego.
Si es así, los pagos correspondientes a los puntos en silla de montar son empleados para determinar
movimientos óptimos para los dos jugadores, se puede considerar el siguiente juego, por ejemplo:
Estrategia de B
Aquí se tienen dos puntos en silla de montar; uno corresponde a a2 y bl, y el otro corresponde a
a2 y b2. Según el criterio minimax, el jugador A haría el movimiento a2. Al hacerlo, no importa si el
jugador B emplea la estrategia bl o b2, porque en cada caso B debe pagar a A una cantidad de, por
ejemplo, 5 útiles.
También, puesto que el valor del juego en este ejemplo es positivo, se dice que el juego favorece A.
Se dice que un juego de suma cero de dos personas es rigurosamente determinado si existe un
punto en silla de montar, porque ese punto es una solución aceptada al juego de encontrar la mejor
estrategia para cada uno de los dos jugadores.
Estrategia dominante:
Se dice que un jugador posee una estrategia dominante si una estrategia particular es preferida a
521
cualquier otra estrategia a disposición de él. Es posible que cada uno de los dos jugadores tenga
estrategia dominante.
Estrategia mixta:
Es una combinación de dos estrategias escogidas al azar, una cada vez, según determinadas
probabilidades, en contraste con una estrategia pura que no contiene tales elementos de azar.
Conclusiones
La Teoría de Juegos consiste en razonamientos circulares, los cuales no pueden ser evitados al
considerar cuestiones estratégicas. La intuición no educada no es muy fiable en situaciones estratégicas,
razón por la que se debe entrenar. La Teoría de Juegos fue creada por Von Neumann y Morgenstern
en 1944. Otros habían anticipado algunas ideas. Los economistas Cournot y Edgeworth fueron
particularmente innovadores en el siglo XIX.
Otras contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo.
A principio de los años cincuenta, en una serie de artículos muy famosa, el matemático John Nash
rompió dos de las barreras que Von Neumann y Morgenstern se habían auto-impuesto.
EJERCICIOS RESUELTOS
I • Mostrar dedos
Dos jugadores muestran simultáneamente uno, dos o tres dedos. Dos dedos vencen a uno, tres
a dos y uno a tres; en los demás casos hay empate. El jugador que vence recibe del otro una
cantidad en pesos igual al número de dedos mostrados en total (suma de los dedos mostrados
por a m b o s jugadores). ¿ C u á l es el valor del juego y las estrategias óptimas?
SOLUCIÓN
1 2 3
1 0
4
2 3 0 - 5
3 - 4 5 0
522
C o m p r o b a m o s si hay estrategias dominadas y vemos que no hay ninguna. Máx i mín ¡ A¡¡ = - 3;
En principio hay que resolver un programa lineal, por ejemplo, el correspondiente al primer
jugador:
Máx V
Sujeta a:
o x . + 3 X 2 - 4X3 > V
- 3 X] + 0X 2 + 5X3 > V
4X, - 5X 2 + 0X3 > V
Xi + X2 + X3 = 1
Xi, x2!/ X3 > 0
X i , X2/ X 3 > o
x ; = Y; = 5/12 =0,410
X;=Y 2 * = 1 / 3 =0,3
X;=Y3*=L/4 =0,25
V* = 0
2 . Elecciones
523