Vous êtes sur la page 1sur 85

La esperanza de la función mínimo es:

Por lo tanto nuestro problema, si reemplazamos en (1) es el siguiente:

Sujeta a:

2 X, + X 2 + 3 X 3 = 1

La solución de la ecuación 2 X, + X 2 + 3 X 3 = I que minimice la función objetivo se obtiene


haciendo:

Por lo tanto el problema se reduce a:

Para obtener el punto, se deriva y se obtiene en el intervalo: 1 < | < 5 :

Luego la solución es:

Encontrar el modelo deterministico equivalente a la siguiente restricción aleatoria:

437
Siendo a una variable aleatoria que se distribuye uniformemente en el intervalo [- 1, 1],

Por ser a una variable aleatoria en el intervalo [ - 1 , 1 ] sus funciones de densidad y de distribución
serán:

Luego:

Haciendo x = Xi - x 2 y suponiendo que Xi - x 2 > 0 podemos escribir:

Calculando el valor de z:

C o m o el papel de z lo hace en nuestro caso tendremos:

A n á l o g a m e n t e se procede, suponiendo que X] - x 2 < 0 y se obtiene la condición


lueqo el modelo equivalente sería:

438
Si tenemos el problema:

Sujeta a:

Su problema equivalente es el siguiente:

MAX Z = 2 X! + X 2

Sujeta a:

Donde W ] y W 2 son las variables duales asociadas con cada una de las restricciones.

Suponga una función de distribución

Q u e es simétrica con media d.

439
F(X)

De la gráfica anterior se observa que . ¿Para qué argumento de X se tiene


Y = F (X) ?

Por definición de función inversa se tiene que la respuesta es

440
CAPÍTULO XV

ANÁLISIS DE MARKOV

"Nuestros problemas están hechos por el hombre y pueden, por consiguiente,


ser resueltos por el hombre y el hombre es tan grande como quiere serlo ".
John Fitzgerald Kennedy

INTRODUCCIÓN

Un proceso estocástico es en esencia un modelo matemático de un fenómeno que evoluciona en


el tiempo de forma aleatoria. Ejemplos:

El número de llamadas telefónicas recibidas en una estación telefónica hasta cierto instante t.
La sucesión de tiempos que permanecen en el buffer de un conmutador los paquetes de una
conexión en espera de ser transmitidos.
La sucesión de tamaños (en bytes) de los paquetes que llegan a un conmutador de red.

De una manera más formal, un proceso estocástico se define como una familia de variables
aleatorias , definidas sobre un mismo espacio de probabilidad , que representa el
comportamiento aleatorio del fenómeno que se estudia. En este contexto s suele representar el valor
de una variable de interés medida en el instante s, o el valor que toma esa variable sobre el i - ésimo
objeto que interviene en el fenómeno analizado.

En las aplicaciones que veremos, cuando T es continuo suele ser y cuando es discreto
suele ser T = N. Ejemplos:

= Número de llamadas telefónicas recibidas en una central telefónica hasta cierto instante t.

= Tiempo que permanece en el buffer de un conmutador el i - ésimo paquete de una conexión


desde que llega hasta que es transmitido.

= Tamaño (en bytes) del i - ésimo paquete de una conexión.

Así mismo, el espacio de probabilidad representa el azar.

Los elementos co e Q son los posibles resultados aleatorios de la observación del fenómeno, P es
la función que asigna a los co su probabilidad de ocurrencia , y B es la colección de conjuntos de
a los que se puede asignar de modo consistente un valor de probabilidad.

441
De acuerdo con esta definición, a cada fijo, el proceso le asocia los valores que
denominada trayectoria del proceso constituyen una función de S en R asociada a De esta forma,
podemos considerar un proceso estocástico como una función de dos variables de
en R en la que:

Para cada fijo: es una variable aleatoria.


Para cada fijo: es una trayectoria del proceso.

Si llamamos al espacio de todas las funciones de S en también podemos interpretar un


proceso estocástico con conjunto de parámetros S y valores en como una única aplicación:

Desde esta perspectiva, puede entenderse un proceso estocástico como el conjunto de todas las
posibles formas en que puede evolucionar la variable en estudio (trayectorias) más una distribución de
probabilidad sobre dicho conjunto, que nos indique cuál es la probabilidad de que se produzca cada
trayectoria particular.

El problema es ¿cómo determinar la distribución de probabilidad asociada a un proceso estocástico?


Aunque lo natural sería considerar como distribución del proceso la distribución conjunta de las variables
aleatorias que lo componen, el hecho de que usualmente S sea infinito impide esta aproximación. Los
trabajos de Kolmogorov en los años 30 del siglo pasado condujeron al teorema que lleva su nombre y
que garantiza que bajo ciertas condiciones de regularidad, conocer la distribución (finito-dimensional)
de probabilidad de para todo n y para cualquiera es equivalente
a conocer la distribución de probabilidad del proceso. Ello se traduce, en la práctica, en que el estudio
de los procesos estocásticos se realiza a través de sus distribuciones finito dimensionales.

Procesos Puntuales

Un proceso puntual aleatorio es un proceso estocástico cuyas realizaciones consisten en conjuntos


de puntos distribuidos aleatoriamente sobre un cierto espacio continuo. Tales puntos suelen corresponder,
en la práctica, a los instantes de tiempo en que han ocurrido algunos sucesos de interés, o a las
localizaciones en el espacio de ciertos objetos. Ejemplos

- El conjunto de instantes en que se producen las llegadas o salidas de clientes en cola.

- El conjunto de instantes en que se producen los nacimientos de los individuos de una población.

En estos dos ejemplos, el continuo sobre el que se encuentran distribuidos los puntos es el tiempo.

El análisis de los procesos puntuales se realiza habitualmente a través de sus procesos contadores
asociados.

442
Dado un proceso puntual definido sobre un espacio continuo T, se define su proceso contador
asociado como aquel proceso que a cada subconiunto le asigna el número N(A) de ocurrencias
del proceso puntual localizadas en A. Cuando T es el tiempo, el proceso contador suele expresarse
como donde Nt representa el número de sucesos puntuales que han ocurrido en [0,t],

Si es un proceso contador asociado a un proceso puntual temporal, para s < t el valor de


N t - N s representa el número de ocurrencias del proceso que han tenido lugar en el intervalo (s, t].

Cuando Nt - N s y Nv - Nu son variables aleatorias independientes el proceso


se dice de incrementos independientes. Así mismo, si la distribución de la variable
s < t depende sólo de la diferencia t - s, el proceso se dice de incrementos estacionarios.

Uno de los procesos contadores más importantes es el proceso de Poisson, proceso que se usa
extensamente en teoría de colas.

El Proceso d e Poisson H o m o g é n e o

Un proceso contador es un proceso de Poisson homogéneo si verifica las siguientes


condiciones:

es de incrementos independientes

donde o (A t) es un infinitésimo de orden superior a A t , esto es:

En esta caracterización queda de manifiesto que aquellos procesos de incrementos independientes


tales que, durante un tiempo infinitesimal es muy improbable que ocurra más de un suceso, seguirán
una distribución de Poisson.

Como ejemplo en los que esta condición se da frecuentemente, puede citarse las llegadas de
clientes a una cola. En este caso Nt representa el número de clientes llegados a la cola en el intervalo
de tiempo (0, t].

443
Propiedades del proceso de Poisson

El número de ocurrencias de un proceso de Poisson de parámetro en un intervalo de longitud


X sigue una distribución de Poisson de parámetro

En efecto, por ser el proceso de incrementos independientes, la variable es independiente


de Por tanto:

El proceso de Poisson es de incrementos estacionarios, esto es:

La distribución de probabilidad de los tiempos entre ocurrencias de sucesos de un proceso de


Poisson es exponencial:

En efecto, sea Entonces:

que, como se
observa, sigue una distribución exponencial de parámetro independientemente de n y T n .

El Proceso d e Poisson no H o m o g é n e o

Cuando las condiciones que definen el proceso de Poisson se modifican de modo que la intensidad
del mismo (el valor de X) sea función de t, esto es:

es de incrementos independientes

el proceso resultante se denomina de Poisson no homogéneo de intensidad

Siguiendo un desarrollo paralelo al realizado para el proceso homogéneo, se obtiene que:

444
donde: se denomina función paramétrica del proceso.

PROCESOS DE MARKOV

En muchos sistemas basta conocer su estado actual y las reglas por las que se rige su
comportamiento para predecir su evolución futura. La idea subyacente es que lo que le haya sucedido
al sistema hasta llegar al estado actual no aporta, en orden a predecir su estado en el futuro, ninguna
información que no esté ya recogida en las variables que definen su estado presente (principio de
independencia entre el futuro y el pasado una vez que se conoce el presente). Esta idea puede
generalizarse en un contexto de probabilidades y constituye la base de la definición de los procesos de
Markov.

Un proceso de Markov es un proceso estocástico tal que:

En otras palabras, es un proceso tal que la distribución condicional de su valor futuro dada
toda su evolución hasta el presente depende sólo del valor actual y es independiente del
pasado.

Si además ocurre que P es independiente de s, entonces el proceso se dice


homogéneo o estacionario.

Cuando S es discreto, el proceso de Markov se dice en tiempo discreto, y en tiempo continuo en


otro caso. El conjunto de valores que puede tomar un proceso de Markov recibe el nombre de espacio
de estados del proceso. Cuando el espacio de estados es discreto, el proceso suele recibir el nombre de
Cadena de Markov.

Procesos S e m í m a r k o v i a n o s

Un Proceso Semimarkoviano, también conocido como Proceso de Renovación Markoviano, es


un proceso estocástico con espacio de estados discreto y cuyas transiciones entre estados forman una
cadena de Markov, siendo los tiempos entre sucesivas transiciones variables aleatorias.

En el caso particular de que estas variables sigan una distribución geométrica (cuando el proceso
es en tiempo discreto) o exponencial (cuando el proceso es en tiempo continuo), con parámetro

445
dependiente sólo del estado actual, el proceso es de Markov, debido a la falta de memoria de estas
variables.

C a d e n a s d e M a r k o v e n T i e m p o Discreto

Condición de Markov

Las cadenas de Markov en tiempo discreto constituyen el modelo de proceso de Markov más
simple. El tiempo T es discreto (T = N; en general se llaman etapas a las unidades de tiempo discretas)
y también es discreto (finito o numerable) el espacio de estados, al que llamaremos E. La condición de
Markov se expresa en este caso de la forma:

Cadenas de Markov Homogéneas

Una cadena de Markov es homogénea, cuando verifica:

lo que significa que la probabilidad de pasar del estado i al estado j en una etapa es independiente
de cuál sea esta etapa.

Caracterización de las Cadenas de Markov Homogéneas

Una cadena de Markov homogénea queda determinada por:

1. El espacio de estados E (finito o numerable).


2. La probabilidad de transición del estado i al i, independiente de n,

Obviamente

3. La distribución inicial de la cadena:

Ejemplo

Consideremos un sistema de comunicación que transmite los dígitos 1 y 0. El buffer de entrada de


este sistema tiene capacidad para un máximo de 4 dígitos, lo que significa 5 posibles estados (0,1,2, 3
y 4), que representan el número de bits en el buffer en cada momento. El sistema opera en tiempo
discreto y, llamando a la ocupación del buffer en el slot k, se ha observado que se comporta
según una cadena de Markov homogénea con las siguientes probabilidades de transición:

446
Donde

Si inicialmente el buffer está vacío, la distribución inicial de la cadena es:

Probabilidades de transición en n etapas

Ésta es la probabilidad de que la cadena, transcurridas n etapas, se encuentre en algún estado j,


habiendo partido inicialmente del estado i, esto es:

Para calcular esta probabilidad, si definimos las matrices de probabilidades de transición en una y
n etapas respectivamente, como:

puede probarse el siguiente resultado, conocido como ecuación de Chapman - Kolmogorov: P(n) = Pn

Probabilidades de estado tras N etapas

Si se desea calcular la probabilidad incondicional de que la cadena se encuentre en el estado j tras


n etapas, llamando:

Ejemplo

En nuestro ejemplo anterior, la matriz de probabilidades de transición en 3 etapas es:

447
y las probabilidades de estado en la tercera etapa son:

A continuación presentamos las sucesivas potencias de la matriz de transición:

448
449
450
Como puede apreciarse, las sucesivas potencias de la matriz van pareciéndose cada vez más
entre sí; de hecho, a partir de las matrices son prácticamente iguales (las diferencias
que pudiera haber están por debajo del octavo decimal). Ello significa que las probabilidades de estado
tras n etapas ya no cambian prácticamente a partir de la etapa 17. Tales probabilidades serían:

Por tanto, si el buffer está inicialmente vacío, transcurrido un número de etapas mayor que 17, la
probabilidad de que esté vacío es de 0,207; la probabilidad de que esté ocupado por un solo dígito es
0,235; y la probabilidad de que esté lleno es 0,117.

451
Probabilidades de etapa de primer paso

Otro problema de interés suele ser el cálculo de la probabilidad de que, partiendo del estado i, la
cadena llegue por primera vez al estado j transcurridas n etapas. Esta probabilidad suele denotarse
como:

con la convención de que:

La probabilidad de que la cadena, habiendo partido del estado i, alcance alguna vez el estado j es

entonces:

Si se definen las funciones generatrices:

puede probarse que:

y por tanto:

El número medio de etapas que se emplea en ir de i a j es,

En nuestro ejemplo:

Calculemos la probabilidad de que, partiendo del buffer vacío, alguna vez llegue a haber 3 dígitos
en el mismo. Para ello debemos encontrar:

452
y resolver:

Así pues, la probabilidad de llegar al estado 3 (tener 3 dígitos en el buffer) partiendo del estado 0
(buffer vacío) es: f 03 = F 03 (1) = 0,731635

El número medio de etapas que se tarda en tener 3 dígitos partiendo del buffer vacío es:

Clasificación d e Estados d e una C a d e n a M a r k o v i a n a H o m o g é n e a

• Estados recurrentes: Un estado i es recurrente si f¡¡ = 1.


• Estados transitorios: El estado i es transitorio si no es recurrente, esto es, si f¡¡ < 1.
• Tiempo medio de recurrencia: Es el tiempo medio que se tarda en regresar al estado j
habiendo partido del mismo estado, esto es:

• Estados recurrentes positivos: Un estado j se dice recurrente positivo si Pjj < oo , esto es,
si el tiempo medio que se tarda en regresar a él es finito.
• Estados recurrentes nulos: Un estado j se dice recurrente nulo, esto es, si se tarda un
tiempo medio infinito en regresar a él.
• Estados absorbentes: Un estado i se dice absorbente si p„= 1, esto es, si una vez que la
cadena llega a este estado va no puede pasar a otro distinto de él.

453
• Estados accesibles: Un estado j es accesible desde otro estado i si:

• Estados comunicantes: Dos estados i, j comunican entre sí cada uno de ellos es accesible
desde el otro.
• Estados periódicos: Un estado recurrente i se dice periódico de periodo d si d es el máximo
común divisor de los índices n para los cuales Un estado con periodo 1 se dice
aperiódico. Puede probarse que si el estado i es aperiódico, entonces existe un entero no tal
que

Conjunto cerrado de estados: Un conjunto de estados C es cerrado si:

Conjuntos irreducibles de estados: Un conjunto de estados C es irreducible si es cerrado y


no contiene subconjuntos cerrados. Puede demostrarse que si C es cerrado, entonces es irreducible si
y sólo si todos sus estados comunican entre sí. Los conjuntos irreducibles de estados cumplen las
siguientes propiedades:

a) Si C es irreducible, entonces sus estados son todos transitorios o son todos recurrentes.

b) Si C es irreducible y todos sus estados son recurrentes, entonces Más aún,


o bien o bien (esto es, sus estados o son todos
recurrentes positivos o son todos recurrentes nulos).
c) Si C es irreducible y todos sus estados son recurrentes, entonces todos los estados de C tienen
el mismo periodo.

EJEMPLO

La siguiente es la matriz de transición de una cadena de Markov con 6 estados, numerados de 0 a 5:

454
• El estado 1 es recurrente, pues si el proceso comienza en él, permanece en él para siempre.
• Los estados 2 y 5 son transitorios, ya que pueden ser visitados unas cuantas veces y no volver
a ellos nunca más.
• Los estados 0, 3 y 4 son recurrentes, ya que una vez que el proceso llegue a uno de ellos
permanece en ese conjunto para siempre.
• El conjunto {0, 3,4} es un conjunto cerrado de estados; también es irreducible.
• El conjunto {1} es también cerrado e irreducible.
• El conjunto {2,5} no es cerrado.
• El conjunto {0,1,2,3,4,5} es cerrado pero no irreducible.

C a d e n a s d e M a r k o v con Espacio d e Estados Finitos

Hay una serie de resultados que no se cumplen para Cadenas de Markov con un número infinito
de estados, pero que sí se verifican si este número es finito. Por ejemplo, en una cadena con infinitos
estados podría ocurrir que ninguno fuese recurrente, pero en una cadena finita es evidente que debe
existir algún estado de esta clase. Más aún, todo conjunto de estados cerrado y finito tiene al menos un
estado recurrente.

Teorema 1: Sea R el conjunto de estados recurrentes de una Cadena de Markov con espacio de
estados finito y sin conjuntos cerrados disjuntos, entonces:

c) Si los estados recurrentes son aperiódicos, entonces existe un entero

Distribución Estacionaria d e u n a C a d e n a d e M a r k o v

Sea una Cadena de Markov y sea E = {1,2,3,...} su espacio de estados. La distribución


de probabilidad donde es una distribución estacionaria para
si verifica:

En caso de que exista esta distribución, si p(°) = n , entonces

455
Distribución de Equilibrio de una Cadena de Markov

Un problema de gran interés en las aplicaciones prácticas es el siguiente: transcurrido un número


muy grande de etapas, ¿cuál es la probabilidad de que la cadena se encuentre en un estado j determinado?
Esta pregunta sólo tiene sentido cuando el proceso es ergòdico. Un proceso estocástico es ergòdico
cuando existe la distribución límite:

en cuyo caso se dice que la cadena está en equilibrio. La distribución recibe


el nombre de distribución de equilibrio de la cadena. La ergodicidad significa que transcurridas muchas
etapas, la probabilidad de estar en un estado j, es independiente del estado de partida i.

El siguiente teorema nos indica en qué casos existe la distribución límite de una Cadena de
Markov.

Teorema 2:

(a) es una Cadena de Markov irreducible y recurrente positiva, entonces existe una
única solución no degenerada de las ecuaciones:

(siendo u un vector de unos). Además el vector solución resultante

verifica que:

Si además los momentos de la distribución estacionaria son finitos entonces se tiene:

(b) Si el vector de probabilidades iniciales p<0) se elige de modo que , entonces la cadena
es un proceso estacionario y ergódico.

(c) Si además la cadena es aperiódica, irreducible y recurrente positiva, entonces el proceso es


ergódico y la distribución límite coincide con la distribución estacionaria.

Teorema 3: Una Cadena de Markov aperiódica e irreducible es recurrente positiva si existe una
solución no negativa del sistema de ecuaciones:

tal que:

456
C a d e n a s d e M a r k o v e n Tiempo Continuo con Espacio d e Estados Discretos

En este easo la condición de Markov puede escribirse como:

siendo

Cuando esta probabilidad no depende de s, la cadena es homogénea.

Las Cadenas de Markov en tiempo continuo homogéneas verifican las siguientes propiedades:

(1) cada vez que alcanza el estado i la cantidad de tiempo que la cadena permanece en ese
estado antes de transitar a otro estado sigue una distribución exponencial de parámetro ?i
dependiente del estado de partida.
(2) Cuando el proceso abandona el estado i, entra en otro estado j i con probabilidad p,,,
verificándose:

En otras palabras, una cadena de Markov homogénea en tiempo continuo es un proceso estocástico
que se mueve de un estado a otro de acuerdo con una cadena de Markov en tiempo discreto, pero que
permanece en cada estado durante un tiempo exponencialmente distribuido (con parámetro dependiente
del estado). Además el siguiente estado j al que se mueve el proceso es independiente del tiempo que
haya permanecido en el estado i (si no fuera así se violaría la condición de Markov).

De esta forma, una cadena de Markov homogénea en tiempo continuo queda definida por la
matriz de transición de probabilidades:

De modo análogo al caso de tiempo discreto (en que P ' = Pn), se cumple (ecuación de Chapman-
Kolmogorov): P (t + s) = P (t) P (s)

Así mismo, si pi (t) = P (^ (t) = i), p (t) = (p, (t), p2 (t),...) se tiene:p (t) = p(0) P(t)

Cálculo de la matriz de transición en un tiempo t

Obviamente, la pregunta que cabe hacerse ahora es, ¿de qué modo puede calcularse P(t)?

Para ello, llamamos:

457
tiempo medio que la cadena permanece en el estado i.

Como la distribución de este tiempo es exponencial, es la probabilidad de que la cadena


abandone este estado en el próximo intervalo de tiempo de amplitud

de acuerdo con la definición de el valor t puede interpretarse como la probabilidad


de transitar al estado j desde el estado i en el próximo intervalo de tiempo de amplitud

Si ahora calculamos las probabilidades de transición en un periodo de duración

de donde:

tomando límite cuando se obtiene la ecuación retrospectiva de Kolmogorov:

Para obtener esta ecuación hemos calculado la probabilidad de transición a partir de la


evolucion de la cadena, primero en un lapso y a continuación en un periodo de longitud t. Si hubiésemos
calculado dicha probabilidad partiendo primero de la evolución en un periodo de duración t y a continuación
en otro periodo llegaríamos a:

458
de donde:

tomando límite cuando se obtiene la ecuación prospectiva de Kolmogorov:

Las ecuaciones de Kolmogorov pueden expresarse en forma vectorial, respectivamente, como:

y la solución de ambas viene dada por:

donde, al ser P (0) = I, resulta:

donde:

Debe señalarse que en la práctica no resulta, en general, eficiente calcular P(t) de esta forma,
resultando preferible en muchas ocasiones tratar de obtener los p¡j (t) directamente a partir de alguna
de las ecuaciones de Kolmogorov. Esto es lo que hemos hecho ya en el caso del proceso de Poisson
homogéneo.

Distribución Ergódica d e u n a C a d e n a d e M a r k o v en T i e m p o Continuo

Por último, en analogía con el resultado obtenido para las cadenas en tiempo discreto, a menudo
la probabilidad de que la cadena de Markov se encuentre en el estado j transcurrido un tiempo muy
largo, converge a un valor (probabilidad ergódica) independiente del estado inicial, esto es:

459
El valor de puede interpretarse como la proporción de tiempo que el sistema permanece en el
estado j.

Si es la distribución ergódica de la Cadena de Markov en tiempo continuo, verificará:

y como, de acuerdo con la ecuación prospectiva de Kolmogorov, es

Si la cadena es ergódica, debe ocurrir que:

y por tanto la distribución ergódica debe cumplir: junto con la condición natural de que

, siendo u un vector de unos.

Teorema 3: Una Cadena de Markov en tiempo continuo es ergódica si es irreducible y todos sus
estados son recurrentes positivos.

La probabilidad ergòdica puede interpretarse como la proporción de tiempo que el sistema


permanece en el estado j.

El sistema de ecuaciones admite una interpretación que resulta bastante intuitiva y fácil
de comprender. Si escribimos su desarrollo obtenemos:

En este sistema de ecuaciones, la probabilidad puede interpretarse como la tasa con que el
proceso abandona el estado j.

Así mismo, la probabilidad puede interpretarse como la tasa con que el proceso llega

al estado j desde todos los estados

Claramente, cuando el proceso se encuentra en equilibrio ambas cantidades deben ser iguales.

460
EJERCICIOS RESUELTOS

Determinar cuáles de las siguientes matrices estocásticas son regulares:

Una matriz estocástica es regular si una potencia de la matriz solamente tiene componentes
positivos.

es la matriz unitaria I.

es la matriz A.

Por lo tanto, toda potencia par de A es la matriz unitaria I y toda potencia impar de A es la
matriz A. Por lo tanto, toda potencia de A tiene componentes cero, entonces A no es regular.

b) La matriz B no es regular, puesto que hay uno en la diagonal principal.

c) La matriz C no es regular puesto que tiene un uno sobre su diagonal principal.

Puesto que todas las componentes en D 3 son positivas, D es una matriz estocástica regular.

Encontrar el vector de probabilidad fijo único t de la matriz estocástica regular

¿A cuál matriz se acerca A n a medida que n aumenta?

461
Buscamos un vector de probabilidad t = (X, 1 - X), tal que t A = t. El anterior vector, también se
puede denominar (X, Y):

Multiplicamos el lado izquierdo de la ecuación de la matriz anterior

y luego igualamos unas a otras las componentes respectivas para obtener las dos ecuaciones
siguientes:

el vector de probabilidad pedido es

La respuesta la verificamos multiplicando

La matriz A n tiende a la matriz T, cuyas filas son cada una el punto fijo t; de donde A n tiende a:

Un cuerpo de guardia tiene a su cargo un fuerte provisto de un puesto de centinela en


cada esquina:

Para despistar al enemigo se ha dado la orden a los centinelas de hacer la ronda de la siguiente
m a n e r a aleatoria: Vigilar durante cinco minutos en uno de los cuatro puestos, designado en el

462
último momento por el mando; después, tirar a cara o sello. Si sale sello, ir al primer puesto que
se encuentre a su izquierda (si sale cara a su derecha) y vigilar en él otros cinco minutos; echar
de nuevo la moneda, seguir la misma regla precedente y así sucesivamente.

Aquí diremos que el sistema (fuerte-guardia) se encuentra en el estado ¡ en la fecha n si el


n-ésimo desplazamiento del centinela le ha conducido al puesto i (i = 1 , 2 , 3 , 4); el sistema sigue
una Cadena de Markov, cuya matriz de probabilidades de paso es:

Imaginemos que el centinela empieza su guardia en el puesto 1, o sea:

P (0) = (1 0 0 0), entonces:

La C a d e n a de Markov no es regular, ya que Pn no tiende hacia ningún límite.

Tres C o m p a ñ í a s productoras de pastas alimenticias, Daria, Deria y Diria, d o m i n a n


respectivamente el 50%, 30% y 2 0 % del mercado. Para aumentar sus ventas realizan una campaña
publicitaria después de la cual hacen una encuesta para conocer sus resultados. Estos son los
siguientes:

• De 100 individuos que consumían Daria, resulta que tras la campaña el 6 0 % continúa
con Daria, el 2 5 % se pasa a Deria y el resto a Diria.
• De 1 0 0 individuos consumidores de Deria, el 5 0 % continúa con dicho producto, el 3 0 % se
pasa a Daria y el resto a Diria.
• Finalmente, de 100 consumidores de Diria, el 4 0 % sigue con Diria, el 4 0 % se pasa a Daria
y el resto a Deria.

463
a) ¿Cuál de las campañas es más eficaz?

b) ¿Se conseguirá finalmente un equilibrio en el reparto del mercado?

a) Se puede interpretar como una Cadena de Markov, cuya matriz de transición es:

Tras el primer año de campaña la distribución del mercado será:

Las campañas de las compañías Deria y Diria mejoran el porcentaje de mercado al pasar de
3 0 % a 3 1 , 5 % y de 2 0 % a 21,5%. Para ver si continuando con los mismos métodos de publicidad
se llega a una situación estacionaria, analizamos el grafo asociado a esta cadena:

b) Este grafo es fuertemente conexo y no periódico, lo que nos indica que la cadena es regular
y existirá una distribución límite en caso que la campaña de publicidad se repitiera. Esta
distribución (X^ X 2 X3) es un autovalor por la izquierda de M:

464
0 , 4 X! - 0 , 2 5 X 2 - 0 , 1 5 X 3 =0

- 0 , 3 XÌ + 0 , 5 X2 - 0,2 X 3 = 0

- 0 , 4 Xt - 0,2 X 2 + 0 , 6 X3 = 0

donde la primera ecuación es redundante; las otras dos ecuaciones, ¡unto con Xy + X 2 + X 3 = 1

constituyen un sistema de ecuaciones, cuya solución es:

Finalmente se repartirán el mercado por iguales partes.

La región de ventas de un vendedor la componen tres ciudades A, B y C ; nunca vende en


la misma ciudad en días seguidos. Si vende en la ciudad A, entonces al día siguiente vende en
la ciudad B; sin embargo, si vende en una de las dos ciudades, B o C, entonces al día siguiente
está en doble posibilidad, tanto para vender en A como en la otra ciudad. Se pregunta con qué
frecuencia vende en cada ciudad.

La matriz de transición del problema es:

Buscamos el vector de probabilidad fijo único de la matriz R

Encontramos primero un vector fijo t = (X, Y, Z):

luego de resolver, obtenemos:

t = si multiplicamos por para obtener el vector de probabilidad fijo pedido:

t = Finalmente, el trabajador vende 4 0 % del tiempo en la

ciudad A, 4 5 % del tiempo en la ciudad B y 15% del tiempo en la ciudad C.

465
EJERCICIOS PROPUESTOS

I • Suponga que la probabilidad de lluvia mañana es 0,5 si hoy llueve y que la probabilidad de un día
claro (sin lluvia) mañana es 0,9 si hoy está claro; suponga además que estas probabilidades no cambian
si también se proporciona información sobre el clima de días anteriores a hoy.

a) Explique por qué las suposiciones establecidas implican que la propiedad markoviana se cumple
para la evolución del clima.
b) Formule la evolución del clima como una Cadena de Markov, definiendo sus estados y dando
su matriz de transición (de un paso).

2 • Considere el siguiente modelo para el valor de una acción; suponga ahora que el modelo del
mercado de acciones se cambia; el que una acción suba o no mañana depende de si subió o no hoy y
ayer. En particular, si la acción subió los dos días, la probabilidad de que suba mañana es 0,9. Si la
acción subió hoy pero ayer bajó, mañana subirá con probabilidad de 0,6. Si la acción bajó hoy pero ayer
subió, entonces mañana subirá con probabilidad de 0,5. Por último, si bajó los dos días, la probabilidad
de que mañana suba es 0,3. Si se define el estado como la representación de hecho de que la acción
baje o suba, el sistema ya no se puede representar como una cadena de Markov. Sin embargo, se
puede transformar en una si se definen los estados como sigue: Estado 0: La acción aumentó hoy y
ayer; Estado 1: La acción aumentó hoy y ayer bajó; Estado 2: La acción bajó hoy y ayer aumentó;
Estado 3: La acción bajó hoy y ayer. Esto conduce a una cadena de Markov de cuatro estados con la
siguiente matriz de transición:

'0,9 0 0,1 0 ^
0,6 0 0,4 0
p= 0 0,5 0 0,5
0,3 0 0,7J

Si la acción sube o no mañana, depende de si subió o no hoy y ayer. Si la acción subió hoy y ayer,
mañana subirá con probabilidad a, . Si la acción subió hoy y ayer bajó, mañana subirá con probabilidad
a 2 . Si la acción bajó hoy y ayer subió, la probabilidad de que suba mañana es a 3 . Por último, si la
acción bajó hoy y ayer, la probabilidad de que suba mañana es a 4 .

Determine la matriz de transición de un paso para la Cadena de Markov.

3 • Una empresa de abogados emplea a tres categorías de abogados: principiantes, con experiencia
y socios; durante un año determinado hay una probabilidad 0,15 que un abogado principiante sea

466
ascendido a abogado con experiencia y una probabilidad 0,05 que deje la empresa; también hay una
probabilidad 0,20 que un abogado con experiencia sea ascendido a socio y una probabilidad 0,10 que
deje la empresa; además, existe una probabilidad 0,05 que deje la empresa.

Supongamos que la meta a largo plazo de esta empresa es tener 50 abogados principiantes, 30
con experiencia y 10 socios. Para alcanzar este censo de estado estable , ¿ cuántos abogados de cada
tipo deben contratar cada año ?

Un ratón se coloca en una caja dividida en tres compartimientos, como se ve en la figura:

Si no se dispone de más información, es razonable suponer que el ratón elegirá una puerta al azar
al cambiarse de un compartimiento a otro; como cada una de las puertas tiene la misma probabilidad de
ser elegida, la probabilidad de que un ratón pase a uno de los otros compartimientos es 0,5; esto nos da
la matriz de transición:

Se pregunta a largo plazo, qué tiempo pasará el ratón en cada uno de los compartimientos.

En un día dado, el clima en Manizales puede ser bueno, indiferente o malo; si el clima es bueno
hoy, mañana estará bien con una probabilidad de 0,6, indiferente con una probabilidad de 0,20 y malo
con una probabilidad de 0,20; si el clima es indiferente hoy, mañana será bueno, indiferente o malo con
probabilidades de 0,25,0,50 y 0,25, respectivamente; por último, si el clima es malo hoy, las probabilidades
que mañana el clima sea bueno, indiferente o malo son de 0,25, 0,25 y 0,50, respectivamente. Es de
anotar que este problema se resuelve con la suposición que el clima de hoy se ve afectado únicamente
por el clima de ayer y no por lo que haya sucedido en días anteriores.

Luego de transcurrido mucho tiempo, ¿cómo será el clima en Manizales?

467
CAPÍTULO XVI

DECISIONES MULTICRITERIO Y ANÁLISIS


MULTIOBJETIVO

"Denominamos conocimiento a la pequeña porción de ignorancia


que ordenamos y clasificamos". A. Bierce

INTRODUCCIÓN

La mayoría de los autores utilizan los términos multicriterio y/o multiobjetivo indistintamente. Es
importante aclarar que multicriterio se emplea cuando los problemas de decisión se presentan con
objetivos Z\, z2, z3, ... , zB, con n > 2, es decir, para datos discretos, y los problemas de decisión
multiobjetivo se dan cuando los datos son continuos. Estos métodos también son denominados
Optimización Vectorial y están basados en criterios explícitos para evaluar varias alternativas. Se
utilizan siempre que un grupo de personas debe tomar una decisión importante en la que concurren
distintos aspectos, complejos o controvertidos, fundamentalmente en las etapas de selección y evaluación
de alternativas. Un análisis multicriterio es muy eficaz como orientación en la discusión y consenso del
equipo. A menudo, tras una discusión, los miembros del equipo pueden decidir alterar su evaluación
sobre una o más alternativas y luego ajustar sus puntuaciones en consonancia. Tras la elección de las
alternativas y la determinación de los criterios que se van a utilizar, se ponderan éstos según su importancia,
a los cuales se les asigna un peso específico acorde con su trascendencia en los resultados.

El análisis multicriterio constituye una forma de modelizar los procesos de decisión, en los que
entran en juego: una decisión a ser tomada, los eventos desconocidos que pueden afectar el o los
resultados, los posibles cursos de acción y el o los resultados mismos. Mediante los modelos multicriterio
el decisor podrá estimar las posibles implicaciones que puede tomar cada curso de acción, de modo que
se pueda obtener una mejor comprensión de las vinculaciones entre sus acciones y sus objetivos.

La Optimización Vectorial nace en 1960 en La Haya, en el Congreso de Programación Matemática,


el Discreto con Roy (Electre) y el Continuo con Chames y Cooper. En 1972 se realiza el Primer
Congreso de Análisis Multicriterio, como pioneros se pueden considerar a Keeny, RaiíFa, Brans, Vincke,
Saaty, Roubens, Zeleny, Zionts, Yu, Ignicio y Steuer, entre otros.

Se deben definir los siguientes términos: atributos, objetivos, metas, restricciones y criterios.

Atributos: Son los puntos de vista considerados relevantes para el análisis y/o resolución de un
problema. Es decir, un atributo es una característica intrínseca de las alternativas susceptibles de ser
medidas. Constituyen la base para la toma de decisiones, base que puede ser medida y evaluada. Es la
evidencia sobre la cual se basa una decisión o, dicho de otro modo, es un aspecto medible de un juicio,
por el cual puede ser caracterizada una dimensión de las alternativas bajo análisis.

469
Estos criterios pueden representar diferentes aspectos de la teleología: objetivo, metas, valores de
referencia, niveles de aspiración o utilidad. En el planteo de la matriz de decisión o en la caracterización
de un problema, la identificación de los criterios pertinentes al mismo es de gran importancia para el
logro de los objetivos. La forma en que puede ser medido o caracterizado el criterio también es un
aspecto de gran importancia, ya que de ello dependerá en gran parte el resultado final del proceso de
evaluación.

Desde un punto de vista operativo, los atributos pueden ser clasificados en tres grupos:

i) De beneficio, en los que la preferencia o la utilidad es creciente con el valor o puntaje del
mismo
ii) De costos, los que ofrecen una utilidad monotónica decreciente: cuanto mayor el puntaje,
menor es la preferencia
iii) No monótonos, tales como el contenido de azúcar en la sangre, donde la utilidad máxima es
obtenida en un valor intermedio dentro del rango posible.

Objetivos: Direcciones de mejora de los atributos; la mejora puede interpretarse en el sentido


"más del atributo mejor" o bien "menos del atributo mejor".

Metas: Un nivel de aspiración representa un equilibrio aceptable de logro para el correspondiente


atributo; la combinación de un atributo con un nivel de aspiración genera una meta.

Restricciones: Corresponden a las condiciones que se deben cumplir en los diferentes problemas.
Las restricciones son generadas a partir de la existencia de recursos limitados.

Criterios: Son una herramienta que permite una evaluación de alternativas de acuerdo con un
particular punto de vista. El término criterio se utiliza como una acepción general que engloba tres de
los conceptos precedentes, es decir, los criterios constituyen los atributos, objetivos o metas que se
consideran relevantes para un problema de decisiones.

¿Qué diferencias hay entre objetivos, metas y restricciones? En el contexto que nos ocupa la
distinción entre los tres conceptos es clara. Mientras que la meta establece un nivel aceptable del
atributo, el objetivo lo optimiza, maximizando o minimizando. Para una meta, el segundo miembro es
simplemente un valor al que aspiramos; sin embargo, en una restricción siempre debemos alcanzar ese
valor, porque en caso contrario la restricción no se cumple y sería una solución imposible. En
Programación Matemática con un único objetivo no existe el concepto de meta y se trabaja únicamente
con restricciones.

Ejemplo

En un problema de maximización de utilidades, la utilidad es un atributo, maximizar la ganancia un


objetivo y alcanzar una utilidad al menos igual a un determinado nivel de aspiración es una meta y una
restricción corresponde a los recursos que se tienen disponibles para la producción.

470
El criterio d e o p t i m a l i d a d P a r e t i a n a

En 1896, el Economista Italiano Vilfredro Pareto introdujo un criterio de optimalidad que ha recibido
su nombre y que puede considerarse crucial en teoría económica. En su formulación inicial, Pareto
considera que una colectividad se encuentra en un estado óptimo si ninguna persona de esa colectividad
puede mejorar su situación sin que empeore la situación de alguna otra persona de la misma. Esta clase
de optimalidad se denomina también eficiencia paretiana.

El atractivo del criterio de Pareto es que, aún tratándose indiscutiblemente de un juicio de valor,
es muy débil, por lo que la mayoría de las personas lo aceptarían razonablemente. Este criterio de
optimalidad paretiana puede transferirse de una manera directa de la economía al análisis decisional
multicriterio. Para ello, basta sustituir el concepto original de Pareto de "sociedad" o "colectivo" de
personas por el de conjunto de criterios. Así, cada criterio individual representa a una persona en esta
nueva interpretación. Esta traslación del concepto de optimalidad paretiana juega un papel esencial en
los diferentes enfoques desarrollados dentro del paradigma multicriterio. Puede decirse que la eficiencia
paretiana es una condición exigida como necesaria para poder garantizar la racionalidad de las soluciones
generadas por los diferentes enfoques multicriterio.

El concepto de optimalidad paretiana dentro del campo multicriterio puede definirse formalmente
de la siguiente manera. Un conjunto de soluciones es eficiente (o pareto óptimas) cuando está formado
por soluciones factibles (esto es, que cumplen las restricciones), tales que no existe otra solución
factible que proporcione una mejora en un atributo sin producir un empeoramiento en al menos otro de
los atributos. A título de ejemplo, supongamos que en un problema de selección de un modelo de
caza-bombardero el centro decisor considera como relevantes los siguientes atributos: velocidad, carga
máxima, coste y maniobrabilidad.

Todos los enfoques multicriterio pretenden obtener soluciones que sean eficientes en el sentido
paretiano que acabamos de definir. Incluso dentro de la programación multiobjetivo, el primer paso
consiste en obtener el conjunto de soluciones factibles y eficientes. Esto es, el conjunto de soluciones
posibles se particiona en dos subconjuntos disyuntos. El subconjunto de soluciones factibles no eficientes
y el subconjunto de soluciones factibles y eficientes. Una vez realizada tal partición, se introducen de
diferentes maneras las preferencias del centro decisor con el objeto de obtener un compromiso entre
las soluciones factibles y eficientes.

TASA DE INTERCAMBIO O TRADE-OFF ENTRE CRITERIOS

Otro concepto importante es el de tasa de intercambio o trade-off entre criterios. La tasa de


intercambio entre dos criterios significa la cantidad de logro de un criterio que debe sacrificarse para
conseguir a cambio un incremento unitario en el otro criterio.

Las tasas de intercambio tienen un doble interés dentro de la metodología multicriterio. Por una
parte, constituyen un buen índice para medir el coste de oportunidad de un criterio en términos de los
otros que estemos considerando. Por otra, el concepto de tasa de intercambio juega un papel crucial en
el desarrollo de los métodos interactivos multicriterio. La interacción se traduce en una especie de
diálogo en la que el que toma las decisiones transmite al analista sus preferencias medidas por las tasas
de intercambio o trade-off.

471
PRINCIPALES ENFOQUES MULTICRITERIO

La diferenciación conceptual entre atributos, objetivos y metas nos permite efectuar una primera
aproximación metodológica a los diferentes enfoques multicriterio. Así, cuando la toma de decisiones
se sitúa en un contexto de objetivos múltiples, el enfoque multicriterio a considerar es la programación
multiobj etivo. Si la toma de decisiones se realiza en un contexto de metas múltiples, el enfoque multicriterio
es la programación por metas.

Finalmente, si el contexto en la toma de decisiones está caracterizado por varios atributos, el


enfoque multicriterio a considerar es la teoría de la utilidad con atributos múltiples. El propósito de este
enfoque consiste en construir una función de utilidad con un número de argumentos igual al número de
atributos que se consideren relevantes. Este enfoque se suele aplicar a problemas con un número
discreto de soluciones factibles.

ALGUNOS PROBLEMAS CON OBJETIVOS MÚLTIPLES

Existen muchas situaciones en las que interesa contemplar varias características difíciles de
combinar en un único objetivo: rentabilidad y riesgo en las inversiones, beneficio a corto plazo y
crecimiento de la empresa a largo plazo, coste y calidad de los servicios, etc. En general, los problemas
multicriterio pueden tener objetivos intrínsecamente diferentes u objetivos intrínsecamente similares.
En el primer caso, unas veces se puede determinar el coste de oportunidad de un objetivo frente a los
demás y en otras los criterios pueden ordenarse por su importancia. Tanto la programación multiobj etivo
como la programación por metas son técnicas útiles en la toma de decisiones en las que se dan este tipo
de circunstancias.

Uno de los muchos problemas reales en los que se ha aplicado la programación multiobj etivo es el
uso múltiple del suelo público. Así, la administración se puede plantear que la gestión del suelo tenga en
cuenta la rentabilidad y los valores históricos, ecológicos, de medio ambiente, de recursos hidráulicos,
etc. Muchas veces también se pretende conservar ciertas tierras públicas en su condición natural, que
proporcionen hábitat y alimento, tanto a la vida salvaje como a los animales domésticos y, por último,
tengan en cuenta el uso recreativo.

Muchos de estos objetivos entran en conflicto. Las asociaciones agrícolas desean más tierras de
cultivo y/o pastoreo, las compañías mineras desean derechos de explotación y los grupos de conservación
del medio ambiente desean mantener algunas áreas en su estado natural.

Otra aplicación es la construcción de aeropuertos en grandes ciudades. Una lista de posibles


objetivos en este caso es la siguiente:

- Minimización de los costes totales de construcción, mantenimiento y operación


- Minimización del tiempo de acceso al aeropuerto
- Maximización de la seguridad de operación
- Minimización del efecto de la contaminación por ruido del tránsito aéreo
- Aumento de la capacidad de tránsito aéreo del aeropuerto

472
PROGRAMACIÓN MULTICRITERIO

Veremos en qué consiste la programación multicriterio con un ejemplo sencillo. El problema es el


siguiente: una finca que actualmente se dedica a la caza se quiere transformar para dedicarla parcialmente
a la ganadería con el fin de aumentar los beneficios que proporciona, sin renunciar totalmente a su
valor recreativo y tratando de mantener en ambos casos un nivel de explotación que garantice el
equilibrio ecológico.

Las variables decisión del modelo, X! y X2, representan las hectáreas dedicadas a pastoreo de
ovejas y las reservadas para caza respectivamente. Los dos objetivos a maximizar son la utilidad y el
valor recreativo de la finca. La función que representa este último se ha construido a partir de una escala
relativa arbitraria de 0 a 4, dando el máximo cuando la superficie se explota sólo para caza y el valor 1
cuando se introduce ganadería. Por diversas razones se considera que no se deben dedicar más de 1500
has a pastoreo, ni más de 1000 has exclusivamente a caza. La superficie total de la finca es de 2000 has.

MAX [Utilidad Zx = 30 Xi + 5 X2; Valor Recreativo Z 2 = X! + 4 X 2 ]

Con sus restricciones:

La Figura 1 representa el conjunto de soluciones factibles y la solución óptima en el caso de


maximizar sólo un único objetivo. Si ésta es la utilidad, la solución óptima es el punto B y si el objetivo
es maximizar el valor recreativo la solución óptima sería el punto C. Con los valores de ambas funciones
objetivo en dichos óptimos construimos lo que se denomina matriz de pagos de la Tabla 1. Así, cuando
se maximiza la utilidad ésta es de 47500 miles unidades monetarias (u. m.) y el valor recreativo de
3500, mientras que al maximizar este último criterio su valor es de 5000 pero el beneficio es inferior al
caso anterior, concretamente 35000 miles unidades monetarias.

El punto (Z\, Z2) formado por los elementos de la diagonal de la matriz de pagos, se llama punto
ideal, donde los dos objetivos alcanzan su óptimo y es normalmente inalcanzable. Tanto este punto
como el punto anti-ideal, que es aquel en que Zx es 35000 y Z2 vale 3500 son importantes en los
métodos de resolución de problemas multicriterio. El punto anti-ideal es una "mala solución", pero es
útil, por ejemplo, para "normalizar" los objetivos medidos en diferentes unidades y con diferentes valores
absolutos. Además, la diferencia entre los valores ideales y antiideales definen un intervalo de valores
para cada criterio que es necesario conocer en algunos métodos de resolución de este tipo problemas.

TABLA 1 MATRIZ DE P A G O S

473
TABLA 2 VALORES DE LAS VARIABLES D E C I S I Ó N Y DE LOS OBJETIVOS EN LOS P U N T O S EXTREMOS

F I G U R A 1 C O N J U N T O FACTIBLE Y S O L U C I Ó N Ó P T I M A C O N U N OBJETIVO ÚNICO

La Tabla 2 recoge las coordenadas de los puntos extremos OABCD en el espacio de las variables
de decisión representadas en la Figura 1, así como las de sus correspondientes objetivos que están
representados gráficamente en la Figura 2 por los puntos O'A'B'C'D'.

F I G U R A 2 C O N J U N T O EFICIENTE EN EL ESPACIO DE LOS OBJETIVOS

474
Cuando hay objetivos en conflicto como en este caso, el punto ideal donde todos los objetivos
alcanzan su óptimo no existe. Por tanto, la resolución de un modelo multicriterio lo que hace es encontrar
el conjunto eficiente. Un punto pertenece al conjunto o frontera eficiente cuando cumple las restricciones
y no hay otra solución posible que mejore alguno de los objetivos sin empeorar al menos otro. Observando
la Figura 2, es evidente que la frontera eficiente de nuestro problema es el segmento C' B'. Observar
que el conjunto eficiente se puede definir en términos de puntos extremos eficientes (B' y C') o en
términos de puntos extremos e interiores (el segmento B ' C '). También es interesante resaltar que la
pendiente del segmento B' C' nos proporciona la tasa de intercambio entre los objetivos y por tanto es
una medida del coste de oportunidad de uno por otro.

Obtenido el conjunto de puntos eficientes se puede optar por una solución atendiendo a criterios
subjetivos en problemas pequeños. Por otra parte, es obvio que se ha podido resolver gráficamente el
problema anterior por ser un modelo con dos variables de decisión y dos objetivos y se ha hecho así por
motivos pedagógicos. En problemas de mayor tamaño se puede obtener por diversos métodos. Entre
ellos están el método de las restricciones y el de las ponderaciones.

CLASIFICACION DE LAS TECNICAS MULTICRITERIO Y MULTIOBJETIVO

Método Electre (I, II, III y IV)


Técnicas de
Sobreclasificación Método Promethee

Técnicas basadas Método de las Jerarquías


Analíticas (AHP)
en clasificaciones o
"ranking" de alternativas Método de Arrow-Raynaud

Método de la Teoría de la Utilidad


Técnicas basadas en
funciones de utilidad Multiatributo (MAUT)

Método de las Ponderaciones


Técnicas Generadoras Método de las Restricciones
Método NISE
Método del Simplex Multiobjetivo

Técnicas Programación por Metas


Multiobjetivo Técnicas con Información
(Continuas) a Priori
Programación Compromiso

Método Stem
Técnicas Interactivas
Método de Zionts & Wallenius
Método de Geoffrion

475
CARACTERÍSTICAS DE LAS TÉCNICAS GENERADORAS

Reciben el nombre de técnicas generadoras aquellas cuyo objetivo es obtener o "generar" el


conjunto completo de soluciones eficientes o un subconjunto significativo del mismo.

Desde el punto de vista de la relación entre el analista y el decisor, el flujo de información va del
primero hacia el segundo. Dicho de otro modo, el analista proporciona al decisor la información que
éste necesita para decidir. Esta información viene dada en términos de soluciones eficientes. Es, por
tanto, el decisor quien, a la vista de las alternativas que posee, elige la que le parece más satisfactoria.

MÉTODO DE LAS PONDERACIONES

Aplicando este método, se generan puntos extremos eficientes, a diferencia del anterior en A que
se generaban puntos extremos e interiores. Esta técnica consiste en agregar todos los objetivos en una
función donde a cada uno se le asigna un peso W no negativo de la siguiente manera:

MAX WJ Z, (X) + W 2 Z 2 (X) + ... + WN ZN (X)

donde W > 0 y se cumplen las restricciones del problema. Variando paramétricamente los pesos
W se puede generar o al menos aproximar el conjunto eficiente.

En nuestro ejemplo el modelo sería:

MAX W1 (30 XI + 5 X2) + W2 (XI + 4 X2)

Sujeta a:

Por ejemplo, para los valores de W¡ = 1 y W2 = 2 se obtiene el punto extremo eficiente B' y para
W, = 1 y W 2 = 10 se obtiene el C'.

Es necesario hacer hincapié en que tanto este método como los demás métodos multicriterio no
tienen en cuenta las preferencias del que toma las decisiones. Por tanto, los W elegidos no guardan
ninguna relación con dichas preferencias. Dichos pesos juegan el papel de parámetros que se hacen
variar arbitrariamente con el fin de generar los puntos extremos eficientes del problema que estemos
considerando.

476
Por último, tanto el método de las restricciones como el de las ponderaciones sólo garantizan
aproximaciones al conjunto eficiente. Por detallado que sea el análisis paramétrico nunca podremos
tener la certeza de no haber omitido algún punto eficiente.

MÉTODO DE LAS RESTRICCIONES

Este método consiste en optimizar uno de los objetivos, mientras que los otros se tratan como
restricciones paramétricas. Está demostrado que para cada conjunto de valores del vector de segundos
miembros o términos independientes se obtiene un punto eficiente, bien extremo 0 interior. Por tanto,
para resolver el problema se puede utilizar el software de programación lineal. El modelo sería el
siguiente

Para cada valor del parámetro P se genera un punto eficiente. El intervalo de variación de P será
el que nos marca el punto ideal y anti-ideal. En la Tabla 3 se recogen algunos puntos de la frontera
eficiente. Es importante saber que este método garantiza soluciones eficientes sólo cuando las
restricciones paramétricas se verifican estrictamente en el óptimo. Esto ocurre en todos los puntos
presentados en la Tabla 3, dado que Z2 y P coinciden.

TABLA 3 . P U N T O S EFICIENTES G E N E R A D O S A PARTIR DEL M É T O D O DE LAS RESTRICCIONES

477
En general, el método de las restricciones cuando hay n objetivos sería

MAXIMIZAR Zk (X)

Restricciones del modelo: En los objetivos que haya que minimizar y estén como restricciones
paramétricas se invertirá el sentido a la restricción. Así, si hubiera que minimizar Zx se colocaría

OTRAS TÉCNICAS MULTICRITERIO

Otro método es el método multicriterio NISE (Nonlnferior Set Estimation). Este método consiste
en una aplicación iterativa del método de las ponderaciones, con la peculiaridad de que los pesos no se
eligen arbitrariamente, sino que el cociente de sus valores (Wj / W2) es igual a la pendiente de la recta
que conecta los puntos eficientes obtenidos en la iteración anterior. Con este método se puede obtener
una rápida y buena aproximación del conjunto eficiente. Incluso para problemas de tamaño moderado
puede generar una representación exacta del conjunto eficiente.

El único método que garantiza la generación de todos los puntos extremos eficientes es el Simplex
multicriterio. El propósito de este método, inicialmente propuesto por Philip (1972) y Zeleny (1973),
consiste en encontrar todos los puntos extremos eficientes de un problema multicriterio desplazándose
para ello de un punto extremo a un punto extremo adyacente. El algoritmo del simplex tradicional
constituye el mecanismo adecuado para efectuar este tipo de desplazamiento.

Hay software basado en el simplex multicriterio como ADBASE y MLP El primero ha sido
diseñado por el profesor Steuer (1983) de la Universidad de Georgia de Estados Unidos. Trabaja
eficientemente con matrices de 50 x 50 y un número de objetivos en torno a tres. Para tamaños
superiores se vuelve inoperante. MLP se basa en el simplex multicriterio desarrollado por Zeleny y su
principal atractivo es que se puede utilizaren computadores personales, sin embargo, sólo es útil para
abordar pequeños problemas multicriterio.

Por último, hay un problema operativo en todos los métodos multicriterio y que consiste en el
elevado número de puntos eficientes que generan. Este problema de excesiva información puede
paliarse reduciendo el conjunto de puntos eficientes de diversas formas, entre las que se encuentran las
operaciones de poda y filtrado. Con estas técnicas se descartan soluciones eficientes que no son
excesivamente diferentes de otras obtenidas previamente.

PROGRAMACIÓN POR METAS

La generación de soluciones eficientes en un problema multiobjetivo cuando aumenta el número


de objetivos y restricciones puede complicarse demasiado. Aun cuando se obtenga o se aproxime, su
número puede ser tan elevado que no sea fácil hacer una elección. En esos casos se puede recurrir a
otros enfoques multiobjetivo más pragmáticos, tales como la programación por metas.

478
X
~ BIBLIOTECA

A l g u n a s definiciones

Vamos a revisar la terminología que nos permitirá comprender mejor la metodología de la


programación por metas.

Variable de decisión
Representa algo que está bajo nuestro control y que puede tener impacto sobre la solución del
problema. Amenos que se indique lo contrario, se asume que las variables son no negativas.

Variables desviación
Reflejan la falta (N¡) o el exceso de logro (P¡) de un objetivo i. Todas son no negativas.

Modelo de programación lineal por metas


Si se tratan los objetivos y las restricciones de una manera simétrica, estará formado por m
funciones lineales, n variables decisión y 2m variables desviación. Cada una de estas funciones es una
meta, tanto si originalmente era una restricción como un objetivo.

Solución factible
Cualquier conjunto de variables decisión y desviación no negativas.

Solución básica
Si (n + 2m) - m variables (decisión o desviación) se hacen cero y se resuelven las m metas, la
solución resultante es una solución básica. Las m variables que no se hacen cero son las variables
básicas y las que se han anulado son las no básicas.

Solución degenerada
Cualquier solución básica en que una o más de las variables básicas vale cero.

Solución implementable
Es una solución posible en la que todas las restricciones rígidas o absolutas se satisfacen. Esto es,
la primera prioridad se logra completamente (ai = 0).

Función de logro
Indica el grado de logro asociado a cada meta. Dada una función que hay que minimizar
lexicográficamente, la función de logro es un vector ordenado.

Solución óptima
En programación por metas con prioridades, la solución óptima es la solución posible asociada
con el vector de logro minimizado.

Soluciones óptimas alternativas


Un problema de programación por metas tiene soluciones óptimas alternativas si el espacio de
solución asociado con este problema es mayor que un punto; si el espacio de solución es una región,
cualquier punto de la misma es una solución óptima alternativa. Es decir, tendrá el mismo vector de
logro.

479
Solución no acotada
Si hemos asociado niveles de aspiración a todos los objetivos, un programa por metas no puede
tener solución ilimitada o solución indeterminada.

ESTRUCTURA GENERAL DE UN MODELO DE PROGRAMACIÓN POR METAS

La programación por metas se basa en establecer cuantitativamente un nivel aceptable de logro


para cada uno de los objetivos y después buscar la solución que haga mínima la suma ponderada de las
desviaciones de cada objetivo frente al valor numérico fijado.

La programación por metas está en la línea de la filosofía que propone Herbert Simon (Nobel de
Economía, 1978). Según Simon, el contexto decisional actual está definido por información incompleta,
recursos limitados, multiplicidad de objetivos, conflicto de intereses, etc. En este contexto complejo
muchas veces el que toma las decisiones intenta que una serie de metas relevantes se aproxime lo más
posible a unos niveles de aspiración fijados de antemano.

Según Romero (1993), en los últimos años la programación por metas constituye no sólo el enfoque
multicriterio más profusamente aplicado, sino también uno de los métodos de investigación operativa
de mayor popularidad. Este autor recoge más de 350 referencias bibliográficas de aplicaciones de la
programación por metas aparecidas en la literatura.

En el tema anterior de programación multicriterio definimos los conceptos de atributo, objetivo,


nivel de aspiración y meta. El primer paso en la formulación de un modelo de programación por metas
consiste en fijar los atributos que se consideren relevantes para el problema que estemos analizando.
Una vez establecidos los atributos se determina el nivel de aspiración que corresponde a cada uno. Es
decir, el nivel de logro que deseamos alcanzar.

METODOLOGÍA PARA LA CONSTRUCCIÓN DEL MODELO

i. Definir las variables de decisión.


ii. Definir los objetivos organizacionales y cuantificarlos.
iii. Ordenar los objetivos de acuerdo con su importancia organizacional.
iv. Definir las ponderaciones dentro de cada nivel de prioridad.
v. Definir las relaciones.
vi. Construir el modelo.
vii. Encontrar la solución.
viii. Validar el modelo y su solución.
ix. Utilizar el modelo como prototipo para analizar alternativas.

480
MODELO GENERAL

r=k i=m

MINW = £ P r Z ( W u d r + W - d : )
r=l i=l

Con sus restricciones:


j=n
X] a ü Xj + d r - d j " =b, i=l,2,3,---,m
j=i

§ > i j X j ( < = >) = b, i=l,2,3,---,m+p


j='
X j 5 dr,dr > 0

Donde

Xj: Variables de decisión


a¡j : Coeficientes técnicos
b,: Objetivos
b¡: Recursos
p r : Coeficientes de prioridad para la desviación r; > p2 . . . > p k : relación de prioridad
w¡~r :Ponderación de en la prioridad r
w ^ :Ponderación de en la prioridad r
d~ : Desviación por debajo del objetivo bi i = 1, 2, 3, ... , m
d*: Desviación por encima del objetivo bi i = 1, 2, 3, ... , m
W: Función ordinal que representa los objetivos respecto a sus desviaciones, su prioridad y sus
ponderaciones

Análisis de las desviaciones: Sea el objetivo b,

d~1 d1+

d^ : Indica que el objetivo b¡ se excedió en la cantidad d^

d~ : Indica que al objetivo b¡ le faltó la cantidad d¡~

En términos de Programación Lineal la variabilidad dcorresponde a una variable de exceso y la


variabilidad d~ representa una variable de holgura.

481
La relación entre d~ y d* :
d" x d+ =

Se presentan varios casos:

i. Se permiten varias desviaciones

£ £
b;=k

Se desean unas utilidades de k u. m. / mes = b¡

ii. Se permite la desviación d~ : Se desea utilizar la capacidad de planta existente b¡ = n horas y


no se permite uso de capacidad extra.

£
b¡= n

iii. Se permite la desviación d* : No se acepta producir por debajo del punto de equilibrio bi = 1.

£
bí=l

En este caso se recomienda colocar ambas desviaciones, las cuales serán controladas con la
función objetivo.

iv. Se tienen limitaciones de recursos, pero no desviaciones.

a¡j(> = < ) b j i = m + 1, m + 2 , ... , p.

Aplicación

Se tiene un fabricante de productos químicos que está considerando la posibilidad de producir a


gran escala dos tipos de sustancias denominadas A y B mensualmente. El fabricante desea maximizar
la utilidad (objetivo 1), la cual para A es de 2 u. m. y la de B es de 3 u. m.; pero a la vez desea hacer
mínima la cantidad de contaminación (objetivo 2), cuyos costos son de 4 u. m. y 2 u. m. para las
sustancias A y B respectivamente.

Para fabricar la sustancia A se requiere 1 hora de mano de obra, 2 unidades del compuesto r y 1
hora de empaque. En la producción de la sustancia B se necesitan 3 horas de mano de obra, 1 unidad

482
del compuesto r y 1 hora de empaque. Para mano de obra la compañía tiene 24 horas diarias, se poseen
18 unidades del compuesto r por día y como máximo se tienen 10 horas diarias para empaque.

Se tiene entonces un problema con dos (2) objetivos que tratamos de satisfacer simultáneamente
y que son total o al menos parcialmente conflictivos.

Variables de decisión:

Xj: Cantidad a producir de la sustancia A por día.


X 2 : Cantidad a fabricar de la sustancia B diariamente.

Modelo:

MAX Z = 2 X, + 3 X 2 (Utilidad)
MIN W = 4 X! + 2 X 2 (Contaminación)

Sujetas a las siguientes restricciones:

Xi + 3X 2 < 24
2X, + X2 * 18
X, + X2 ^ 10
X,, X2 > 0

Vamos a reescribir este problema, tomando Z = 28 y W = 24 (metas planteadas por el decisor),


como un problema de programación por metas, dado por:

MIN Y = | 2 X 1 + 3 X 2 - 2 8 | + | 4 X , + 2 X 2 - 2 4 |

Con sus restricciones:

X, + 3X 2 < 24
2X, + X2 ^ 18
X, + X2 ^ 10
X,, x 2 > o

Pasando a la forma equivalente:

i=2

i=l

483
Sujeta a:

X, + 3 X2 < 24
2 X, + X2 < 18
x, + x2 < 10
2 X, + 3 x 2 - d;+ dr= 28
+
4 X, + 2 X 2 - d 2 + d¡ = 24
X], x2, , 5 ?
>— 0

Resolviendo el anterior problema con WINQSB Versión 1.00 Copyright © Yih - Long Chang,
llegamos a las siguientes respuestas:

x ;1= — = 2 , 4 ; X*22= — = 7,2; < = 0 ; < = 1 , 6 ; d,+*= 0; d2* = 0; Y* = j =1,6


5 5 5

132 *
Siendo Z = = 26,4 y W = 24. Es decir, para la meta correspondiente al beneficio, hay una

desviación por defecto de 1,6 unidades ( d¡* = 1,6), mientras que la meta correspondiente a contaminación
queda satisfecha.

PROCESO ANALITICO JERARQUICO (AHP)

La Teoría de "Analityc Hierarchy Process" fue desarrollada por Thomas L. Saaty a finales de los
años setenta.

Idea Jerárquica
OBJETIVO GLOBAL

Criterio

Subcriterio Subcriterio Subcriterio Subcriterio Subcriterio Subcriterio

484
Alternativas

Comparación por pares

• Comparación binaria de criterios


a¡j = 1 igualmente importantes
a¡j = 3 ligeramente más importante
a¡j = 5 notablemente más importante
a¡j = 7 demostrablemente más importante
a¡j = 9 absolutamente más importante
aji = 1 / a¡j

• Matriz de comparaciones

EXPERIENCIA EDAD DISPONIBILIDAD TRATO CAPACIDAD


EXPERIENCIA 1 7 1,5 2 1
EDAD 1/7 1 1/5 1/ 3 1/ 8
DISPONIBILIDAD 1 / 1,5 5 1 2 1/2
TRATO 1/2 3 1/ 2 1 1/2
CAPACIDAD 1 8 2 2 1

• Análisis de Inconsistencia

Autovalor dominante y autovector asociado

w = 5,03786

EXP EDAD DIS TRA CAP

2,95 0,42 2,06 1,33 3,24

^-MAX ~ ^
Coeficiente de Inconsistencia: CI = - — ; CI = 0,0095
n -1

0,0095
Ratio de Inconsistencia: RI = ; RI = ; RI = 0,0085
CIA 1,12

Si RI < 10 %, aceptar; en caso contrario, se deben reestimar algunos o todos los a¡j.

Uno de los paquetes de software utilizados en los Procesos Analíticos Jerárquicos es el Expert
Choice.

485
EJERCICIOS RESUELTOS

I • Un productor de fríjol posee 85 hectáreas de terreno para cultivar dos variedades de fríjol:
Bola Negra y Bola Blanca. La variedad Bola Negra deja un beneficio de 9 6 0 0 0 0 u.m./ha,
necesitándose 3 hor/ha de uso de maquinaria y 80 hor/ha de mano de obra. La variedad Bola
Blanca genera una utilidad de 7 5 0 0 0 0 u.m./ha, se requieren 2 hor/ha de uso de maquinaria y
6 0 hor/ha de mano de obra. La cooperativa local ha asignado 2 1 0 horas de maquinaria y
5 9 0 0 horas de mano de obra.

Supongamos que el Ministerio de Agricultura ha decidido para la cosecha del año que viene,
planificar la producción de cada una de las dos variedades de fríjol. La distribución es asignada
dependiendo del número de hectáreas de cada una de las fincas.

A nuestro agricultor le han propuesto, tras un estudio de las características de su finca,


manteniendo las disponibilidades de maquinaria, mano de obra y cultivando la totalidad de su
finca que: primero, dedique al cultivo de fríjol Bola Blanca al menos 45 hectáreas, y segundo, las
hectáreas dedicadas al cultivo de fríjol Bola Negra no pueda ser superior a 3 0 hectáreas. Plantear
y resolver el problema de Programación por Metas que se genera.

Variables de decisión:

XT : Cantidad de hectáreas que el agricultor dedica al cultivo de fríjol Bola Negra

X 2 : Número de hectáreas que el agricultor dedica al cultivo de fríjol Bola Blanca

Modelo:

Restricciones de maquinaria, mano de obra y totalidad del cultivo:

MAX Z = 9 6 0 0 0 0 X + 7 5 0 0 0 0 X2

Con sus restricciones:

3Xt + 2 X2 < 210

8 0 X! + 6 0 X2 < 5900

XI + X2 < 85

X!,X2 > 0

El conjunto de oportunidades es:

486
x2

FIGURA N ° 1

Primero se impone que se dedique al cultivo de Bola Blanca al menos 4 5 hectáreas, por tanto la
meta es: x 2 ^ 4 5 , que se transforma en x 2 + ni - pi = 4 5 , la función de realización
correspondiente a este primer nivel de prioridad sería: hi(ni, pi) = n^

Segundo, impone que la variedad Bola Negra no puede superar las 3 0 hectáreas, luego
xi < 3 0 , entonces, xi + n 2 - p 2 = 3 0 y h 2 (n 2 , p 2 ) = p 2 .

Con estas condiciones el problema de programación por metas resultante es:

LEXMIN ( n l í P 2 )

Sujeta a:

3 Xt + 2 X2 < 210

8 0 Xt + 6 0 X2 < 5900

X, + X2 < 85

X2 + ni - pi = 45

XT + n2 - p2 = 30

X u X 2 , n u n 2 , pi, p 2 > 0

N i v e l 1:

M I N n.

Sujeta a:

487
3X, + 2X2 210

8 0 X, + 6 0 X2 ^ 5900

Xt + X2 ^ 85

X 2 + nn - p! = 45

XT, X 2 , n , , pi > 0

Aplicando el Programa L I N D O Release 9 . 0 para Programación Lineal obtenemos:

LP O P T I M U M F O U N D AT STEP 0

OBJECTIVE F U N C T I O N VALUE

1)0

VARIABLE VALUE REDUCED COST


NI 0.000000 1.000000
X1 0.000000 .000000
85.000000 .000000
P1 40.000000 .000000

N O . ITERATIONS^ 0

C o m o el valor de n i = 0 obtenemos que se ha verificado la primera meta, y pasamos al segundo


nivel.

Gráficamente:

X2

FIGURA N° 11

488
N i v e l 2:

M I N p2

Sujeta a:

3 X, + 2 X2 < 210

8 0 X, + 6 0 X2 < 5900

Xi + X2 < 85
x 2 + ni - P! = 45

r>i = 0

Xi + n2 P2 = 30

Xi, X 2 , ni, n 2 , pi, P2 > 0

Aplicando el Programa LINDO Release 9.0 para Programación Lineal obtenemos:

LP O P T I M U M F O U N D AT STEP 0

OBJECTIVE FUNCTION VALUE

1)0

VARIABLE VALUE REDUCED COST

P2 0.000000 1.000000
X 0.000000 .000000
,
X2 85.000000 .000000
P1 40.000000 .000000
N2 30.000000 .000000

N O . ITERATIONS= 0

De esta forma el agricultor dedica las 85 hectáreas a la variedad de Bola Blanca superando la
meta en 4 0 hectáreas y no produce variedad Bola Negra. Con esta combinación satisface las
metas impuestas por el Ministerio.

Gráficamente el conjunto de soluciones satisfactorias sería:

489
x2

9
Una compañía aérea tiene dos clases de aviones, Boeing 7 5 7 y Airbus 3 3 0 para cubrir un
determinado trayecto. Los Boeing deben hacer más veces el trayecto que los Airbus, pero los
Boeing no pueden sobrepasar los 120 viajes. Entre los dos tipos de aviones deben hacer más de
6 0 vuelos, pero menos de 2 0 0 vuelos. En cada viaje de los Boeing la compañía gana 3 0 0 0 0 0
u. m. y en cada uno de los Airbus 2 0 0 0 0 0 u. m.

Tras un estudio, la compañía ha estimado que en cada vuelo de los Boeing se consumen 9 0 0
litros de combustible y en cada vuelo de los Airbus se consumen 9 0 0 litros. Si se desea seguir
maximizando los beneficios y a la vez minimizar el consumo de combustible. ¿Cuál sería el
problema resultante? ¿Explique brevemente con qué tipo de técnicas lo resolvería?

Variables reales:

XT : Cantidad de vuelos de los aviones tipo Boeing.


X 2 : N ú m e r o de vuelos de los aviones tipo Airbus.

Modelo:

MAX Z = 3 0 0 0 0 0 X, + 2 0 0 0 0 0 X 2

M I N W = 9 0 0 X] + 7 0 0 X 2

Sujeta a:

X, > X2
X] — 120
6 0 < Xt + X 2 < 200

XI, X2 > 0

490
Donde f, (X 1; X2) = 3 0 0 0 0 0 X, + 2 0 0 0 0 0 X 2 corresponde a la función de beneficios y f 2 (X 1f X2)
= 9 0 0 XT + 7 0 0 X 2 corresponde al gasto en combustible. Gráficamente el conjunto de
oportunidades es:

X2

FIGURA N°4

Los óptimos individuales corresponden a los vértices (120, 80) y (30, 30): gráficamente, para la
primera función:

FIGURA N° 11

491
Y para la segunda:

X2

FIGURA N ° 6

La matriz de pagos, tras evaluar los óptimos individuales en cada uno de los objetivos,
corresponde a:

f. -f2
X* =(120, 80) 52000000 - 164000
x ; = (30, 30) 15000000 - 48000

Se ha considerado - f 2 para tener los dos objetivos bajo máximo. Una vez determinada la matriz
de pago obtenemos el rango de variación de las correspondientes funciones.

Para los beneficios f] tomaremos valores en [ 1 5 0 0 0 0 0 0 , 5 2 0 0 0 0 0 0 ] y para la c contaminación


f 2 o los tomamos en [ 4 8 0 0 0 , 1 6 4 0 0 0 ] , si lo mantenemos en mínimo. Si consideramos - f 2
tomamos [- 1 6 4 0 0 0 , - 4 8 0 0 0 ] ,

Para resolver el problema podríamos utilizar la programación por metas, debiendo imponer
niveles de prioridad y metas sobre el planteamiento del problema.

Para ello, supongamos que: la empresa cuenta tan sólo con 7 5 0 0 0 litros de combustible y
estima unos costes de 2 4 millones que es evidente que desea cubrirlos. Con esta información
del problema podemos construir las metas y determinar las funciones de realización.

El combustible está limitado a 7 5 . 0 0 0 litros, por tanto:

9 0 0 Xt + 7 0 0 X 2 < 7 5 0 0 0

492
t?; Oí

? BIBLIOTECA
NIIPté
Entonces 9 0 0 X, + 7 0 0 X2 + n, - p, = 7 5 0 0 0 y h ^ n , , pi) = pi

Como queremos cubrir los costos, los beneficios deberán de ser superiores. Luego: 3 0 0 0 0 0 Xi
+ 2 0 0 0 0 0 X2 > 2 4 0 0 0 0 0 0 y la meta:

3 0 0 0 0 0 X, + 2 0 0 0 0 0 X2 + n 2 - p 2 = 2 4 0 0 0 0 0 0

La función de realización h 2 (n 2 , p 2 ) = n 2 .

El problema de metas correspondería a:

LEX M I N ( p l , n2)

Con sus restricciones:

-X, + X2 < 0
<
Xi 120
>
X, + X2 < 60
X ] + X2 200
9 0 0 X1 + 7 0 0 X2 + n-| - p, 75000
3 0 0 0 0 0 X, + 2 0 0 0 0 0 X 2 + n2 - p2 = 24000000
X 1f X 2 , n 1 ( n 2 , pi, p 2 > 0

N i v e l 1:

M I N p.

Sujeta a:

- X, + X2 < o
<
Xi 120
>
X, + X2 < 60

X, + x 2 200
9 0 0 X, + 7 0 0 X2 + n, - p, = 75000

Xi,X2, ni,pi > 0

Aplicando el Programa LINDO Release 9 . 0 para Programación Lineal obtenemos:

LP O P T I M U M F O U N D AT STEP 2

OBJECTIVE F U N C T I O N VALUE

1) 0.000000

493
VARIABLE VALUE REDUCED COST
P1 0.000000 1.000000
X 30.000000 .000000
i
2 X 30.000000 .000000
NI 27.000000 .000000

N O . ITERATIONS = 2

Como p! = 0, pasamos al siguiente nivel. Gráficamente:

X2

FIGURA N ° 7

N i v e l 2:

M I N n2

Con sus restricciones:

- X, + X2 < 0

Xi < 120

Xi + X2 > 60

Xi + X2 < 200

9 0 0 X, + 7 0 0 X2 + n, - P! = 75000

Pi = 0

3 0 0 0 0 0 Xi + 2 0 0 0 0 0 X2 + n2 - p2 = 24000000

X l 7 X 2 , n l 7 n 2 , pi, p 2 > 0

494
LP O P T I M U M F O U N D AT STEP 2

OBJECTIVE F U N C T I O N VALUE

1) 0.000000000

VARIABLE VALUE REDUCED COST


N2 0.000000 1.000000
P2 0.000000 .000000
Xi 80.000000 .000000
X2 .000000 .000000
Pl .000000 .000000
NI 3000.000000 .000000

N O . ITERATIONS= 2

De acuerdo al resultado, la compañía debe realizar 8 0 vuelos con los aviones Boeing y ninguno
con los Airbus.

El conjunto de soluciones satisfactorias sería:

X2

FIGURA N ° 8

Un estudiante está en época de exámenes y dentro de cinco días tiene el examen de


calificación de las competencias en la carrera, en el que van tres temas, A, B y C; en el examen
hay una parte teórica y otra práctica con preguntas de los tres temas en las dos partes y
siempre en igual importancia entre los temas. Sabiendo que:

495
a. Por cada cinco horas de estudio obtiene un punto en la parte estudiada.
b. Cada parte, la teórica y la práctica, vale 12 puntos.
c. Debe obtener al menos cinco puntos en el teórico y en el práctico para tener lugar a cómputo.
d. Se aprueba con una media, entre teórico y práctico de 7 puntos.
e. No se puede estudiar más de 16 horas al día.

Formule el modelo que le determine el número de horas de estudio de cada uno de los temas,
en cada una de sus partes, teórica y práctica si desea.

1. En primer lugar sacar al menos 5 puntos en la parte práctica.


2. Si eso lo consigue, le gustaría al menos conseguir 4 puntos en el teórico, para justificarse
que poco faltó para obtener dos cincos.
3. Además, su tercer deseo consiste en no estudiar más de 8 horas cada día, pues no sólo de
calificación de las competencias en la carrera vive el ser humano.
4. Por último, y esto es más que un deseo, es la felicidad plena, es poder aprobar el examen.

Variables reales:

Xi: Número de horas estudiando teoría tema A


X 2 : Cantidad de horas estudiando práctica tema A
X3: Número de horas estudiando teoría tema B
X4: Cantidad de horas estudiando práctica tema B
X5: Número de horas estudiando teoría tema C
X 6 : Cantidad de horas estudiando práctica tema C

Modelos:

Primer Nivel de Prioridad:

M I N n.

Con sus restricciones:

< 12

< 12

Xi + X2 + X3 + X4 + X5 + X6 < 80

1
+ ~ X6 + n, - p! 75000

a a a 0
1, X2/2 , X3,3 , X4,4 , X 5 , X ó , n 1 ( pi
Xi, >

496
Segundo Nivel de Prioridad:

M I N n2

Con sus restricciones:

1 1 1
gX] + - X3 + - x5 < 12

1
v 1 1

5X2 + 5 X4 + - X6 < 12

Xi + X2 + X3 + X4 + X5 + Xó < 80
1
5 xv2 + -1 vx 4 + 1- x6 + m - p, = 5
ni 0
1 1
1 X
5 i + g X3 + — X5 + n2 - p2 = 4

Xi, X2( X3, X4, X5, Xó, ni, n 2 , pi, p2 > 0

Tercer Nivel de Prioridad:

MIN p3

Con sus restricciones:

¡X2 + 1 x4 + ¡

Xi + x2 + x3 + x4 + x5 + x6
1 1
1 Y 2 + V
5 5 4
+ g X6 + n, - pi

ni
1
1 YAl + 5l vX3 + - X5 + n2 - p2
5

n
2

Xi + X2 + X3 + X4 + X5 + Xó + n3 p3

Xi, X2, X3, X4, X5, X6, ni, n2, n3, pi, p2, p3
Cuarto Nivel de Prioridad:

M I N n4

Con sus restricciones:

1 1 1
gX, + - x 3 + - x 5 < 12

1 X
-
1+ - X 1 + - X6 ¿ 1 2
2 4

X! + X 2 + X3 + X4 + X5 + X6 ^ 80

1 1 1
5Xl +
5*3 +
5Xs * 5

1 1 1

-X 2 + - X4 + - X6 > 5

1
-X + -
1 X + -
1 X + ni - Pi =
2 4 ó ni = 05
1 1 1
- Xi + — X3 + — X5 + n2 - p2 = 4

n2 = 0

Xi + X 2 + X3 + X4 + X5 + X6 + n3 - p3 = 40

1 1 1 1 1 1
v „ Xi + —— X 2 + —— X 3 + , — X4 + —— X5 + —— XA + n4 - p4 = 7
10 10 10 10 10 10
X
l/ X2/ X3/ X4, X5/ X6/ n l/ n2/ n 3 / n4/ Plí P2/ P3/ P4 ^ 0

4
Una empresa produce dos artículos, A y B, cuyos precios de venta en el mercado son de
6 u. m. y 9 u. m. respectivamente. Los recursos utilizados en la fabricación de A y B y sus
consumos, por unidad, están dados en la siguiente tabla:

Recurso r Recurso s Recurso t


Artículo A 1 2 1
Artículo B 3 1 1
Máximo disponible 24 18 10
Costo del recurso 1 1 2

498
El gerente de la empresa establece un conjunto de metas con el siguiente orden de importancia:

P r i m e r nivel d e p r i o r i d a d : El costo total de los recursos no debe superar el presupuesto


disponible que es de 52 u. m.

S e g u n d o nivel d e p r i o r i d a d : Los ingresos por venta deben ser como mínimo de 60 u. m.

Tercer nivel d e p r i o r i d a d : Satisfacer como mínimo la demanda. A partir de estudios de mercado,


se estima que para A es al menos de 2 y para B es al menos de 5; las dos con igual importancia.

a. Construya un modelo de Programación por Metas Lexocográficas, que responda a los


deseos del gerente.

b. Resuelva el problema gráficamente, indicando el conjunto de soluciones que verifica cada


una de las metas y si existen soluciones satisfactorias.

Definición d e v a r i a b l e s :

XA : Cantidad de artículos del tipo A que se deben producir


XB : Número de productos del tipo B a fabricar

Modelo:

MAX Z = 6 XA + 9 XB

Con sus restricciones:

X, + 3X2 < 24
2 X, + X2 ^ 18
Xt + X2 10
XlfX2 > 0

El conjunto de oportunidades es:

X.

FIGURA N° 11

499
Respecto a las metas del problema, primero se impone que el coste total de los recursos no debe
superar el presupuesto disponible que es de 52 u. m. El costo que supone producir una unidad
de A se corresponde con 1 + 2 + 2 u. m., es decir, 5 u. m. y el costo que supone una unidad de
B asciende a 3 + 1 + 2 u. m., es decir, 6 u. m. Por tanto esta primera meta resulta 5XT + 6x 2 <
5 2 , es decir, 5x] + óx 2 + ni - p 1 = 5 2 , siendo la función de realización, h](ni, pi) = pi.

Segundo, impone que los ingresos por venta han de ser como mínimo de 6 0 u. m., luego 6x1 +
9x2 ^ 6 0 , entonces, 6x1 + 9x2 + n 2 - P2 — 6 0 y h2(n2, P2) = n 2 .

En tercer lugar, se desea satisfacer, como mínimo, la demanda. Puesto que se estima que para
A es, al menos, de 2, y, para el tipo B, es, al menos, de 5, las dos con igual importancia, en este
nivel de prioridad existen dos metas, la primera Xi > 2, entonces, xi + n 3 - p 3 = 2 y la segunda
X2 ^ 5, entonces, X2 + n 4 - p 4 = 5 siendo la función de realización de este nivel h 3 (n 3 , p 3 , n 4 , p 4 )

= n3 + n4.

Con estas condiciones el problema de Programación por Metas resultante es:

LEXMIN (p 1( n 2 , n 3 + n 4 )

Con sus restricciones:

X] + 3X2 < 24

2 X, + X2 < 18

Xi + x2 < 10

5 X] + 6 X2 + ni - Pi = 52

6 Xt + 9 X2 + n2 - p2 = 60

Xi + n3 - p3 = 2

X2 + n4 P 4 = 5

X, , X 2 , n 1 ( n 2 , n 3 , n 3 , p 1 ( p 2 , p 3 , P4 > 0

Por niveles los problemas que se van resolviendo son:

Nivel 1:

M I N p!

Sujeta a:

XT + 3X 2 < 24

2 X] + X2 < 18
Xt + X2 < 10
5 X] + 6 X2 + ni - pi = 52

X i , X 2 , n^, pi > 0
Aplicando el programa LINDO Release 9 . 0 para Programación Lineal obtenemos:

OBJECTIVE F U N C T I O N VALUE

1) 0 . 0 0 0 0 0 0 0 E + 0 0

VARIABLE VALUE REDUCEDCOST


P1 0.000000 1.000000
X, 0.000000 .000000
x2 0.000000 .000000
NI 52.000000 .000000

C o m o el valor de p! = 0 obtenemos que se ha verificado la primera meta y pasamos al segundo


nivel.

Gráficamente:

X2

F I G U R A N ° 10

Nivel 2:

M I N n2

C o n sus restrcciones:

X, + 3X2 24

2 X, + X2 18

501
Xt + X2 < 10
5 Xt + 6 X2 + ri! - Pi 52
Pi 0
6 X] + 9 X2 +n 2 - p2 60
Xi, X2, n n , n 2 , p], p 2 > 0

Aplicando el programa LINDO Release 9 . 0 para Programación Lineal obtenemos:

LP O P T I M U M F O U N D AT STEP 1
OBJECTIVE F U N C T I O N VALUE

1) 0 . 0 0 0 0 0 0 0 E + 0 0

VARIABLE VALUE REDUCED COST


N2 .000000 1.000000
X, .000000 .000000
x2 6.666667 .000000
NI 12.000000 .000000
P1 .000000 .000000
P2 .000000 .000000

C o m o el valor de n 2 = 0 obtenemos que se ha verificado la segunda meta y pasamos al tercer


nivel.

Gráficamente:
X2

FIGURA N° 11

502
Nivel 3:

M I N n3 + n4

Con sus restricciones:

X! + 3 X2 < 24
2Xi + X2 < 18
Xi + x2 < 10
5 X, + 6 X2 + ni - Pi = 52
Pi = 0
6 Xi + 9 X2 + n2 - p2 = 60
n2 = 0
XI + n3 - p3 = 2
X2 + n4 - p4 = 5
Xi , X 2 , ni , n 2 , n 3 , n 4 , p!, p 2 , p 3 , p 4 > 0

Aplicando el programa L I N D O Release 9 . 0 para Programación Lineal obtenemos:

LP O P T I M U M F O U N D AT STEP 1

OBJECTIVE F U N C T I O N VALUE

1) O.OOOOOOOE + OO

VARIABLE VALUE REDUCED COST


N3 .000000 1.000000
N4 .000000 1.000000
X, 2.000000 .000000
X2 5.333333 .000000
NI 10.000000 .000000
P1 .000000 .000000
N2 .000000 .000000
P2 .000000 .000000
P3 .000000 .000000
P4 0.333333 .000000

Así pues, puesto que el valor de la función objetivo es cero, existen soluciones satisfactorias, y
de esta forma, la empresa debe producir 2 unidades del primer producto y 5 , 3 3 3 3 unidades de
B. Con esta combinación satisface todos los deseos del gerente.

Gráficamente el conjunto de soluciones satisfactorias sería el sombreado en la figura y el punto


señalado en la figura es el que se ha obtenido analíticamente.

503
x2

F I G U R A N ° 12

5 • Una empresa de alimentación produce dos tipos de espaguetis: delgados y gruesos.


Cada kilogramo de espaguetis delgados le reporta a la compañía una utilidad de 2 u. m. y
requiere 6 minutos en su máquina cortadora. Cada kilogramo de espaguetis gruesos le genera
a la empresa una ganancia de 1,4 u. m. y precisa 4 minutos de tiempo en la cortadora. La
compañía tiene 4 0 horas de tiempo de máquina disponible esta semana y necesita producir, al
menos, 100 kilogramos de espaguetis delgados y 2 5 0 kilogramos de espaguetis gruesos. Además
de maximizar la ganancia total, la empresa quiere minimizar el consumo de energía. Se sabe
que el consumo de energía es de 1 Kw por kg de espagueti delgado y la misma cantidad por kg
de espagueti grueso.

a. Formule el problema de Programación Multiobjetivo que permita obtener el plan de


producción que maximiza las ganancias de la empresa y minimiza el consumo de energía.

b. Si la máxima ganancia se alcanza en el punto (100, 450) y por otra parte el mínimo de
consumo de energía en (100, 250), elabore la matriz de pagos.

c. Si es posible, dibuje el conjunto de puntos eficientes.

d. ¿Qué se entiende por solución satisfactoria? Indique alguna técnica para su obtención.

V a r i a b l e s d e decisión:

a. X n : Cantidad de kg de espaguetis delgados a fabricar por semana


X 2 : Número de kg de espaguetis gruesos a producir semanalmente

Modelo:

MAX Z = 2 X, + 1,4 X2

504
MIN W = X I + X2

Con sus restricciones:

6 X, + 4 X2 < 2400
Xt > 100
X2 > 250
X l f X2 > 0

El conjunto de oportunidades es:

X2

Los objetivos de la empresa son, por un lado, maximizar las ganancias de la empresa y, por
otro, minimizar el consumo de energía. Así pues, los objetivos son:

MAX Z = 2 X, + 1,4 X 2

M I N W = Xt + X 2

Por tanto, el problema multiobjetivo que permite el plan de producción que maximiza las ganancias
de la empresa y minimiza el consumo de energía es el siguiente:

MAX Z = 2 X, + 1,4 X 2

M I N W = X, + X 2

Sujeta a:

6 X, + 4 X2 < 2400
Xi > 100
x2 > 250
Xi , X2 > 0

505
Para la obtención de los óptimos individuales, tendríamos que resolver dos problemas
correspondientes a:

1. Beneficios

AAAXZ(X 1 ,X 2 ) = 2 X , + 1,4 X 2

Con sus restricciones:

ó X] + 4 X2 < 2400
Xt > 100
X2 > 250
Xlf X2 > 0

2. Energía

M I N W (X,,X 2 ) = Xt + X 2

Sujeta a:

6X, + 4 X2 < 2400


Xi > 100
X2 > 250
X, , x 2 > 0

Si representamos gráficamente ambos problemas, calculando sus correspondiente óptimos y


curvas de nivel, obtenemos que:

fi (XT , x 2 ) = Z (x 1( x2) alcanza su máximo en el vértice (100, 450)

X2

100 200 300

FIGURA N ° 1 4

h ( x i , x 2) — W (x-|, x2) alcanza su mínimo en el vértice (100, 250)

506
"2

X,
100 200 300

FIGURA N ° 1 5

b. La matriz de pagos, tras evaluar los óptimos individuales en el otro objetivo nos quedaría:

f, = Z - f2 = - W
x; = ( 1 0 0 , 4 5 0 ) 830 - 650
x ; = (100, 250) 550 - 350

Se ha considerado f 2 , para tener los dos objetivos bajo máximo.

c. El conjunto de puntos eficientes se corresponde con el segmento de la frontera del conjunto


de oportunidades que va desde el punto (100, 2 5 0 ) al punto (100, 450).

100 200 300


-> X.

FIGURA N° 16

507
d. Una solución satisfactoria es un punto que verifica las restricciones originales del problema
y además las metas impuestas por el decisor, en el caso de que este haya impuesto niveles de
aspiración a los objetivos del problema. La técnica que encuentra soluciones satisfactorias se
denomina Programación por Metas.

EJERCICIOS PROPUESTOS

I • Un impresor desea planificar el trabajo de la próxima semana para lo cual tiene ofertas de
trabajo muy superiores a sus posibilidades de realización, por lo que debe decidir el número y tipos de
trabajos, trabajo tipo A, encuademación de volúmenes, tipo B, picado, impresión y encuademación de
textos y tipo C, diseño gráfico e impresión de pósters, almanaques. Sabiendo que los tiempos consumidos
por cada tarea como media son los dados por la tabla y que en el taller trabajan tres personas, una en
el computador, otra en la encuademación y otra en la máquina offset, a razón de 5 días a la semana y
8 horas al día, se desea:

a. Formular el modelo maximizando los beneficios y minimizando los trabajos del tipo C.
b. Si en lugar de lo expuesto en el apartado anterior, se plantea cubrir con las utilidades al menos
el sueldo de los trabajadores más los seguros e impuestos, que ascienden a un total de 225000
u. m. y además que el número de horas no ocupadas sea al menos superior al 3% de la
jomada semanal, para la resolución de imprevistos.

Formule el modelo correspondiente.

Tipo A Tipo B Tipo C


Computador - 30 4
Offset - 40 6
Encuademación 5 60 -

Utilidades 800 100000 20000

2 • En una planta química se producen tres compuestos, C 1; C2 y C 3 a partir de dos procesos, I y


II. La siguiente tabla contiene las horas necesarias en cada proceso para obtener una unidad de cada
producto y el máximo disponible para cada proceso, así como la utilidad unitaria y el coste de la mano
de obra de cada tipo de producto.

508
Proceso 1 Proceso 2 Utilidad Costo Mano de Obra
C, 1 3 3 2
C2 1 4 2 1
C3 1 1 2 1
Máximo disponible (u. m.) 70 80

Las metas que se desean conseguir son las siguientes:

Primer nivel de prioridad: Obtener un beneficio, como mínimo, de 100 u. m.

Segundo nivel de prioridad: El costo de la mano de obra no debe superar el presupuesto de 50 u. m.

Tercer nivel de prioridad: La fabricación de C] y C 2 debe ser al menos de 10 unidades.

a. Formule el modelo de Programación por Metas Lexicográficas apropiado a los deseos de la


empresa, e indique el problema a resolver en cada nivel.
b. ¿Es el punto (0, 10, 40) una solución satisfactoria? ¿Por qué?
c. ¿Toda solución satisfactoria es eficiente? ¿Por qué?

3
Una empresa se dedica a la fabricación de dos productos, A y B, que se elaboran, tanto en
horas ordinarias como en horas extras de trabajo. Los objetivos económicos que se plantean para el
próximo ejercicio son los siguientes:

• Maximizar los ingresos.


• Minimizar los costes.
• Maximizar la producción.

Además de estos objetivos, hay que considerar un conjunto de condiciones, las cuales están
relacionadas con la producción mínima requerida para cada tipo de producto, así como con la
disponibilidad de horas de trabajo en tiempo normal y en tiempo extra:

En horas ordinarias de trabajo, cada unidad del producto A necesita 3 horas para su fabricación y
cada unidad del producto B, 2 horas, siendo el tiempo disponible al día de 120 horas.

Por otro lado, si los productos se fabrican en horas extraordinarias, se necesita 1 hora de trabajo
por unidad de producto (tanto en el A como en el B), disponiéndose de un total de 20 horas extras.
Debido a un contrato de suministro con su mejor cliente, la empresa debe fabricar al menos 30 unidades
diarias del producto A, ya sea en tiempo normal como en tiempo extra, imponiendo la misma restricción
al producto B.

Cada unidad producida del producto A proporciona un ingreso de 10 u. m. y un coste de 6 u. m. si


se realiza dentro de la jornada normal; si se produce en el tiempo extra, dicho ingreso se reduce a 8,5

509
u. m. y el coste a 3 u. m. para el producto B, el ingreso es de 8 u. m. y el coste de 4 u. m. en jornada
normal y también se reduce a 7 u. m. y 2 u. m. respectivamente, en tiempo extra.

Las metas que la empresa desea conseguir son las siguientes:

Primer nivel de prioridad: Obtener un ingreso que supere, como mínimo, las 700 u. m. diarias.

Segundo nivel de prioridad: Los costes de la empresa no deben sobrepasar el nivel presupuestado
de 500 u. m. diarias.

Tercer nivel de prioridad: El nivel de producción total, tanto en el tiempo normal como en el
tiempo extra, debe situarse exactamente en las 100 unidades de demanda media diaria estimada.

Se pide:

a. Formular el modelo de Programación por Metas Lexicográficas apropiado a los deseos de la


empresa, e indique el problema a resolver en cada nivel.
b. Si fabrica 10 unidades del producto A en horas ordinarias, 20 unidades del producto A en horas
extraordinarias, 45 unidades del producto B en horas ordinarias y ninguno del B en horas
extras, ¿es un plan de producción satisfactorio? ¿Por qué?
c. Toda solución satisfactoria es eficiente? ¿Por qué? En el caso que no lo fuese: ¿cómo lo
detectaría?, ¿qué se podría hacer para conseguir, al mismo tiempo, una solución satisfactoria
y eficiente?

4 » Una empresa tiene dos fábricas, A y B, que producen el mismo bien en dos regiones de un
mismo país. La producción de una unidad del bien cuesta un euro en ambas fábricas y el presupuesto
disponible para cubrir los costos semanales totales es de 16000 u. m.. El empresario exige que la
diferencia entre la producción del bien en la región Amenos la de la fábrica de la región B sea menor
o igual que 6.000 unidades. La empresa desea:

• Maximizar el beneficio total, siendo el beneficio unitario del bien en las fábricas A y B de 6 u.
m. y 3 u. m., respectivamente.

Minimizar el pago de impuestos a la producción, que es de 0,75 u. m. por cada unidad producida
en la región A y 0,25 u. m. por cada unidad producida en la región B.

a. Plantee el problema biobjetivo y el problema ponderado asociado al mismo. ¿Qué tipo de


soluciones del problema biobjetivo se obtienen al resolver el problema ponderado?

b. Suponga que la empresa establece las siguientes metas con el orden secuencial de importancia:

Primer nivel de prioridad: El beneficio total debe ser, como mínimo, de 9.000 u. m..
Segundo nivel de prioridad: El pago de impuestos no debe superar los 2.000 u. m..

510
bl. Construya un modelo de programación por Metas Lexicográficas que responda a los deseos
de la empresa.

b2. Resuelva el problema gráficamente, indicando cuáles son las soluciones satisfactorias del
problema.

5 • Una empresa fabrica dos tipos de productos, A y B. La producción de cada kilogramo de


producto A precisa 3 horas de fabricación y 2 horas de control, generando una ganancia de 1 unidad
monetaria, mientras que la producción de cada kilogramo de B requiere 5 horas de fabricación y 1 hora
de control. La maquinaria necesaria para el proceso de fabricación está disponible no más de 40 horas,
mientras que para el proceso de control no lo está más de 20 horas. La utilidad de cada unidad de
producto B es el doble del beneficio por unidad de producto A. La empresa desea maximizar el beneficio
y maximizar la producción total.

a. Plantee el problema de Programación Multiobjetivo y el problema ponderado asociado. ¿ Qué


tipo de soluciones del problema multiobjetivo obtenemos al resolver el ponderado ?

b. Suponga que la empresa establece las siguientes metas con su respectivo nivel de importancia:

Primer nivel de prioridad: El beneficio total debe ser, como mínimo, de 5 u. m.

Segundo nivel de prioridad: La producción total debe ser, como mínimo, de 12 unidades.

Plantee el problema de Programación por Metas Lexicográficas que responda a los deseos de la
empresa e indique el problema a resolver en cada nivel.

Resuelva el problema gráficamente indicando, si hay o no, soluciones satisfactorias.

Ante la gráfica obtenida, ¿qué le diría a la empresa?

511
CAPÍTULO XVII

TEORÍA DE JUEGOS

"Nunca consideres el estudio como una obligación, sino como una oportunidad para penetrar en
el bello y maravilloso mundo del saber". Albert Einstein

INTRODUCCIÓN

La característica principal de los problemas de decisión que se estudian bajo la Teoría de Juegos
reside en el número de decisores que son más de uno y tienen intereses contrapuestos, por lo que
estamos en un ambiente de conflicto; un juego de estrategia tiene, por tanto, más de un decisor y los
resultados de cada jugador no sólo dependen de sus acciones, sino también de las acciones seguidas
por el resto de los decisores. La Teoría de Juegos se debe básicamente a John von Neumann y Oscar
Morgenstern; actualmente tiene muchas aplicaciones, sin embargo, la economía es el principal cliente
para las ideas producidas por los especialistas en Teoría de Juego. Entre las disciplinas donde hay
aplicación de la Teoría de Juegos tenemos:

En la Economía

No debería sorprender que la Teoría de Juegos haya encontrado aplicaciones directas en economía.
Esta ciencia se supone que se ocupa de la distribución de los recursos escasos. Si los recursos son
escasos es porque hay más gente que los quiere, de la que puede llegar a tenerlos.

Este panorama proporciona todos los ingredientes necesarios para un juego. Además, los
economistas neoclásicos adoptaron el supuesto de que la gente actuará racionalmente en este juego.
En un sentido, por tanto, la economía neoclásica no es sino una rama de la Teoría de Juegos.

Los economistas que no se dan cuenta de ello son como el monsieur Jourdain de Le Bourgeois
Gentilhomme, de Moliere, que se sorprendió de saber que había estado hablando en prosa durante toda
la vida sin saberlo. Sin embargo, aunque los economistas pueden haber sido desde siempre especialistas
camuflados en Teoría de Juegos, no podían progresar por el hecho de no tener acceso a los instrumentos
proporcionados por Von Neumann y Morgenstern. En consecuencia, sólo podían analizar juegos
particularmente simples. Esto explica por qué el monopolio y la competencia perfecta se entienden
bien, mientras a todas las demás variedades de competencia imperfecta que se dan entre estos dos
extremos sólo ahora se les está empezando a dar el tratamiento detallado que merecen.

La razón por la que el monopolio es simple desde el punto de vista de la Teoría de Juegos es que
puede ser tratado como un juego con un único jugador, porque como la competencia perfecta es simple
es que el número de jugadores es de hecho infinito, de manera que cada agente individual no puede
tener un efecto sobre agregados de mercado si él o ella actúa individualmente.

513
En la Ciencia Política

La Teoría de Juegos no ha tenido el mismo impacto en la ciencia política que en economía. Tal vez
esto se deba a que la gente conduce menos racionalmente cuando lo que está enjuego son ideas, que
cuando lo que está enjuego es su dinero. Sin embargo, se ha convertido en un instrumento importante
para clarificar la lógica subyacente de un cierto número de problemas más paradigmáticos.

Un ejemplo de Teoría de Juegos en la Ciencia Política es el siguiente:

La elección de programa: Hay dos partidos, los Formalistas y los Idealistas. Ninguno de los dos se
preocupa en absoluto por cuestiones de principio. Sólo se preocupan por el poder y, por tanto, eligen el
programa con el único objetivo de maximizar el voto en las próximas elecciones. Los votantes, por otra
parte, sólo se preocupan por cuestiones de principio y, por ende, carecen por completo de fidelidad a los
partidos.

Para simplificar, las opiniones que un votante puede tener se identifican con los números reales en
el intervalo (0, 1), en otras palabras, el conjunto de valores de X que satisfacen 0 menor igual a X
menor igual a 1. Podemos imaginarnos que este intervalo representa el espectro político de izquierda a
derecha. Así, alguien con la opinión X = 0, se cree que la sociedad debería estar organizada como un
hormiguero, mientras que alguien en la opinión X = 1 cree que debería estar organizada como una
piscina llena de tiburones.

Cada partido centra su programa en algún punto del espectro político y no puede cambiar su
posición posteriormente. Los electores votan por el partido que se encuentra más cerca de su posición.
Dado que se supone que los votantes se encuentran distribuidos uniformemente sobre el espectro
político, es decir, que una fracción 1 de la población sostiene opiniones que se encuentran en cualquier
intervalo de longitud 1, es fácil ver cuántos votos conseguirá cada partido una vez que han elegido
programa. El secreto está en buscar el votante mediano entre aquellos cuyas opiniones se encuentran
entre los programas de ambos partidos.

El votante mediano se encuentra a medio partido entre las posiciones políticas de los dos partidos.
Luego, los que se encuentran a la derecha del mediano votante votarán por un partido y los que se
encuentran a la izquierda lo harán por el otro. Supongamos que los partidos bajan al ruedo político uno
a uno. Los Idealistas escogen en primer lugar, y luego lo hacen los Formalistas. ¿Dónde debería colocarse
cada uno? Problemas como éste pueden ser resueltos por inducción hacia atrás. Para cada programa
posible X, los Idealistas se preguntan qué ocurriría si se colocaran en X. Si X es menor a 1/2 los
Formalistas responderían colocándose inmediatamente a la derecha de X. Entonces los Idealistas
recogerían una fracción X de los votantes y los Formalistas recogerían 1 - X. Por tanto, los Idealistas
ganarían menos de la mitad del voto. Lo mismo ocurre si los Idealistas se sitúan en X menor a 1/2,
excepto que ahora los Formalistas responderán colocándose inmediatamente a su izquierda. Por tanto,
lo mejor para los Idealistas es colocarse en el centro del espectro político.

Los Formalistas también se colocarán en X = 112 y el voto se dividirá mitad y mitad. Este modelo
puede tener sentido en la escena política americana. Ciertamente es difícil para muchos europeos
encontrar diferencias significativas entre Demócratas y Republicanos. El modelo, sin embargo, tiene
poco parecido con la escena política europea. ¿Deberían los americanos deducir, por tanto, que los

514
partidos políticos europeos de verdad se toman en serio los principios que hacen suyos? Una conclusión
así sería prematura porque es dudoso que la situación europea pueda ser razonablemente analizada con
un modelo de dos partidos, y esto es cierto incluso para un país como Gran Bretaña en el que sólo dos
de los partidos consiguen un número importante de votos en la mayoría de elecciones. Para explorar
esta cuestión veamos cómo cambiarían las cosas si tuviéramos que tomar en consideración un tercer
partido.

En este modelo, el partido Institucionalista escoge programa después de los Idealistas y Formalistas.
Esto cambia mucho las cosas.

Los Idealistas y los Formalistas ciertamente no se colocarán ahora en el centro del espectro
político. Si lo hicieran los Institucionalistas se podrían ubicar inmediatamente a su derecha o a su
izquierda. Entonces recogerían la mitad del voto dejando que los primeros partidos se dividan la otra
mitad. Un razonamiento por inducción hacia atrás, algunas sutilezas surgen debido al hecho que
disponemos de un número infinito de opiniones políticas, lo cual hace ver que los Idealistas y los Formalistas
se colocarán en X = 1/4 y X = 3/4, dejando que los Institucionalistas adopten la posición centrista X =
1/2. Los primeros partidos recibirán entonces 3/8 de los votos cada uno y los Institucionalistas sólo
recogerán 1/4.

Pero ¿por qué querrían los Institucionalistas entrar en la arena política si están condenados al
papel de Cenicienta, con los primeros partidos en el papel de Hermanas Feas? Modifiquemos por tanto
el modelo, de manera que los Instuticionalistas consideren que vale la pena formar un partido sólo si
pueden prever que recibirán más del 26% de los votos.

En este caso, los Idealistas se moverán un poco hacia el centro, aunque no lo bastante como para
que los Institucionalistas puedan entrar flanqueándolos por la izquierda. Por tanto, sólo se moverán
desde X = 0,25 a X = 0,26. Análogamente, los Formalistas se moverán desde X = 0,75 a X = 0,74. En
esta elección, los Idealistas y los Formalistas se dividen el voto a partes iguales y los Institucionalistas
se quedan fuera.

Un comentarista político, ignorante de la amenaza que supone la entrada de los Institucionalistas


podría fácilmente malinterpretar las razones por las que los Idealistas y los Formalistas han elegido sus
programas. El comentarista podría incluso llegar a pensar que cada partido ni siquiera intenta hacerse
con el centro por cuestiones de principio. Pero es sólo tras un análisis estratégico que la conducta de
los dos partidos puede ser evaluada correctamente. Obsérvese, en particular, que su conducta ha sido
determinada por algo que de hecho no llegó a ocurrir.

Como Sherlock Holmes explicaba, a menudo lo importante es que el perro no ladró aquella noche.

En la B i o l o g í a

Es imposible igualar el entusiasmo con que los biólogos evolucionistas que usan la Teoría de
Juegos explican de conducta animal. No sé si escogen historias poco delicadas deliberadamente, para
dar un poco de sabor a sus relatos con implicaciones sexuales, o si éstos son realmente los mejores
ejemplos para ilustrar de qué manera la Teoría de Juegos es relevante. En cualquier caso, lo que los
biólogos dicen sobre el pez sol es esto.

515
Hay dos clases de machos en esta especie. El primero es un individuo regularmente hogareño
que necesita siete años para alcanzar la madurez. Una vez alcanzada, construye un nido que atrae a las
hembras que ponen huevos. Cuando los huevos han sido puestos, no sólo los fertiliza, sino que defiende
la familia resultante lo mejor que puede, mientras la hembra continúa su vida independientemente. La
otra clase de macho es un pillo.

Por lo que dicen los biólogos, es poco más que un órgano sexual autopropulsado. Este posee
ventaja sobre los machos normales, que consiste en alcanzar la madurez en sólo dos años. Sin embargo,
es incapaz de responsabilizarse por su familia. En lugar de ello, espera escondido hasta que una hembra
que ha puesto sus huevos respondiendo a las señales de un macho normal tenga la oportunidad de
hacerlo. Si el pillo tiene éxito, el macho normal defiende una familia que no está relacionada con él en
absoluto y que lleva por el contrario los genes del pillo.

La Teoría de Juegos sirve para explicar por qué las dos clases de machos pueden coexistir en
proporciones fijas. Para que una historia de Teoría de Juegos se aguante en este contexto, necesitamos
una explicación de cómo los genes se distribuyeron exactamente en la forma necesaria para asegurar
a cada pez optimizarla, dada la mezcla actual en la población de hogareños pillos.

No basta con decir que la naturaleza, "con las garras y las fauces llenas de sangre", actuará de
forma que sólo quienes se adaptan sobreviven. Esta respuesta rehuye el problema de cómo y por qué
resulta que a veces adaptarse implica actuar racionalmente. Esta parece ser una de esas grandes
cuestiones que no tienen respuestas fáciles.

En la Filosofía

Los especialistas en Teoría de Juegos creen que pueden demostrar formalmente por qué incluso
el individuo más egoísta puede descubrir que con frecuencia, cooperar con sus vecinos en una relación
a largo plazo redundará en su propio interés ilustrado. Con este fin estudian los equilibrios de juegos con
repetición -juegos que los mismos jugadores juegan una y otra vez-. Pocas cosas han descubierto en
esta área hasta el presente que hubieran sorprendido a David Hume, quien hace ya unos doscientos
años articuló los mecanismos esenciales. Estas ideas, sin embargo, están ahora firmemente basadas en
modelos formales. Para avanzar más, habrá que esperar progresos en el problema de la selección de
equilibrios en juegos con múltiples equilibrios.

Cuando estos progresos se den, sospecho que la filosofía social sin Teoría de Juegos será algo
inconcebible y que David Hume será universalmente considerado como su verdadero fundador.

Propiedades p a r a el conocimiento común del juego

El Filósofo Hobbes dijo que un hombre se caracteriza por su fortaleza física, sus pasiones, su
experiencia y su razón.

Fortaleza Física: ésta determina lo que alguien puede o no puede hacer. Un atleta puede planear
correr una milla en cuatro minutos, pero sería imposible para la mayoría ejecutar este plan. La Teoría
de Juegos incorpora estas consideraciones en las reglas del juego. Ellas señalan lo que es factible para

516
un jugador. Más exactamente, un jugador queda limitado a escoger en el conjunto de sus estrategias en
el juego.

Pasión y Experiencia: éstas corresponden a las preferencias y creencias de un jugador. En la


mayoría de los casos, ambas deben ser conocimiento común para que sea posible realizar un análisis en
términos de la Teoría de Juegos.

Razón: En problemas de decisión unipersonales, los economistas simplemente suponen que los
jugadores maximizan sus pagos esperados dadas sus creencias. En un juego las cosas son más
complicadas, porque la idea de equilibrio da por supuesto que los jugadores saben algo acerca de cómo
razona todo el mundo.

Conocimiento común de las reglas

Como en muchos resultados de la Teoría de Juegos, no es inmediatamente evidente que esta


conclusión dependa de que el valor de n debe ser conocimiento común. Sin embargo, si el valor n no es
de conocimiento común existe equilibrio de Nash.

La noción de equilibrio es fundamental para la Teoría de Juegos. Pero por qué anticipamos que
los jugadores usarán estrategias de equilibrio. Dos tipos de respuestas hay, en primer lugar del tipo
educativo, éstos suponen que los jugadores tengan al equilibrio como el resultado de razonar
cuidadosamente. No se acepte ante frases que empiezan "si yo pienso que él piensa que yo pienso ...",
por lo contrario, los jugadores proseguirían con razonamiento así hasta el final, por difícil que fuera.

Sin embargo, la respuesta educativa no es la única posible. También hay respuestas evolutivas.
Según éstas, el equilibrio se consigue, no porque los jugadores piensan todo de antemano, sino como
consecuencia de que los jugadores miopes ajustan su conducta por tanteo cuando juegan y se repiten
durante largos períodos de tiempo.

Racionalidad: Es la forma que se comporta alguien bayesiano-racional cuando ha de tomar una


decisión en situaciones donde el resultado de la decisión a tomar depende de sucesos inciertos para
quien ha de tomarla. El o ella actúa como si dispusiera de una medida de probabilidad subjetiva a los
sucesos de los que no está seguro.

En un juego finito de dos jugadores, ningún jugador sabe con seguridad que estrategia pura,
incluso si el oponente mezcla, el resultado final será que se juega alguna estrategia pura, la cual terminará
por utilizar el oponente. Un jugador bayesiano-racional, por tanto, asigna una probabilidad subjetiva a
cada una de las alternativas posibles. Entonces el jugador escoge una estrategia que maximiza su pago
esperado con respecto a estas probabilidades subjetivas.

Por tanto, él o ella se comportan como si estuviera escogiendo una respuesta óptima a una de las
estrategias mixtas del oponente, si la estrategia mixta para la que se elige una respuesta óptima.

La Teoría de Juegos da por supuesto que las creencias de un jugador sobre lo que un oponente
hará depende de lo que el jugador sabe acerca del oponente. Sin embargo, no está ni mucho menos
claro lo que debemos suponer acerca de lo que los jugadores saben de su oponente. La idea de racionalidad

517
se construye sobre la hipótesis de que por lo menos debería ser conocimiento común que ambos
jugadores son bayesianos-racionales.

Equilibrio Correlacionado: Aumann sugiere que deberíamos asumir que es "conocimiento


común" que los jugadores comparten el mismo universo del discurso. Sugiere, además, que los estados
de este universo W se deben suponer completos. Ésto significa que si usted alguna vez llega a saber
qué ha ocurrido con seguridad, entonces usted sabe absolutamente todo lo que concebiblemente pudiera
ser relevante para usted a la hora de tomar una decisión.

La descripción de un estado, por tanto, debe especificar cada detalle del "mundo posible" que
representa. Esto incluye no sólo cómo se comportan los jugadores, sino también cuáles son sus estados
mentales. Ya que los jugadores son bayesianos-racionales, sus estados mentales se pueden resumir en
dos cosas:

Lo que saben y lo que creen:

Bayesianismo: el bayesianismo no requiere habilidades mentales excepcionales por parte de los


jugadores. Estos revisan mecánicamente sus probabilidades subjetivas a medida que disponen de nueva
información y entonces deciden qué hacer por el método igualmente mecánico de maximizar su pago
esperado dadas las creencias actuales.

Los bayesianos ingenuos piensan que no es necesario preguntarse de dónde salen las probabilidades
a priori de los jugadores, o cómo saben éstos cuáles son sus particiones de posibilidades, en particular,
creen que la racionalidad bayesiana dota a quienes la hacen suya con la capacidad de coger del aire
sus creencias subjetivas.

Esta actitud lleva a bayesianos que son muy ingenuos a argumentar que la Teoría de Juegos es
una pérdida de tiempo. Es indudablemente cierto que si no necesitáramos preocuparnos de por qué la
gente cree en lo que cree, entonces las consideraciones sobre equilibrios se harían irrelevantes.

Comentarios Generales

Durante las dos décadas que siguieron a la segunda guerra mundial, uno de los progresos más
interesantes de la teoría económica fue la Teoría de los Juegos y el comportamiento económico, publicada
en un libro de este título bajo la autoridad conjunta de Jhon Von Neumann y Oskar Morgenstern.
Actualmente, el consenso parece ser que la Teoría de los Juegos es más relevante al estudio de
problemas comerciales específicos que a la teoría económica general, porque representa un enfoque
único al análisis de las decisiones comerciales en condiciones de intereses competitivos y conflictivos.

El principal objetivo de la Teoría de los Juegos es determinar los papeles de conducta racional en
situaciones de "juego" en las que los resultados son condicionales a las acciones de jugadores
interdependientes. Un juego es cualquier situación en la cual compiten dos o más jugadores. El ajedrez
y el poker son buenos ejemplos, pero también lo son el duopolio y el oligopolio en los negocios. La
extensión con que un jugador alcanza sus objetivos en un juego depende del azar, de sus recursos
físicos y mentales y de los de sus rivales, de las reglas del juego y de los cursos de acciones que siguen

518
los jugadores individuales, es decir, sus estrategias. Una estrategia es una especificación de la acción
que ha de emprender un jugador en cada contingencia posible del juego.

Se supone que, en un juego, todos los jugadores son racionales, inteligentes y están bien informados.
En particular, se supone que cada jugador conoce todo el conjunto de estrategias existentes, no sólo
para él, sino también para sus rivales, y que cada jugador conoce los resultados de todas las combinaciones
posibles de las estrategias.

Igualmente, en una gran variedad de juegos, el resultado es una variable aleatoria cuya distribución
de probabilidades debe ser establecida para que pueda ser posible una solución para el juego. A este
respecto, debe observarse que las decisiones de los jugadores interdependientes no se toman en un
vacío y que los pagos resultantes de estas decisiones dependen de las acciones emprendidas por todos
los jugadores. Esta interdependencia implica que puede ser inapropiado suponer que los pagos están
siendo generados por un proceso probabilista invariante que no es afectado por el curso de acción que
uno escoja. En otras palabras, la acción que emprende un jugador puede dictar los actos de otros
jugadores o influir en la probabilidad de que se comporten en una forma particular. Esta potencialidad
de posibles efectos en los resultados es la que distingue la toma de decisiones en conflictos y la toma de
decisiones en un medio incierto.

La clase más sencilla de modelo de juego rigurosamente adversario, en el que los resultados
posibles son calificados en orden opuesto por los jugadores.

Entre esta clase, el más común es el juego de suma constante, en el que la suma de las ganancias
de los jugadores es igual, cualesquiera que sea su distribución entre ellos. Un caso especial y el único
que consideraremos de juegos de suma constante, se llama juego de suma cero de dos personas.

JUEGOS DE SUMA CERO DE DOS PERSONAS

Dos compañías de autobuses, Ay B, explotan la misma ruta entre dos ciudades y están enfrascadas
en una lucha por una mayor parte del mercado. Puesto que la parte total del mercado es un 100 por 100
fijo, cada punto porcentual ganado por uno debe ser perdido por el otro. Se dice que tal situación es un
juego de suma cero de dos personas por las razones obvias de que el juego es jugado por dos jugadores
diametralmente opuestos y que la suma de las ganancias y pérdidas es siempre cero.

Si se supone que la compañía A y la compañía B están considerando las tres mismas estrategias
para ganar una mayor parte relativa del mercado, como sigue:

1. al o b l : Sirve refrescos durante el viaje.


2. a2 o b2: Introduce autobuses con aire acondicionado.
3. a3 o b3: Anuncia diariamente en estaciones de televisión en las dos ciudades.

Por comodidad, se supone que antes de comenzar el juego ambas compañías no están haciendo
ningún esfuerzo especial y comparten por igual el mercado 50% cada una. Además, si se supone
también que cada compañía no puede emplear más de estas actitudes o estrategias al mismo tiempo y
que las tres estrategias tienen idénticos costos.

519
Por estos supuestos, hay un total de 3 x 3 = 9 combinaciones posibles de movimientos y cada una
es capaz de afectar a la parte del mercado en una forma específica. Por ejemplo, si A y B sirven
refrescos durante el viaje, se dice que A perdería 10% de la parte del mercado a favor de B, lo que
puede indicar que los refrescos de B son más para los gustos de los clientes, igualmente, si A anuncia
y B, por ejemplo, sirve refrescos, se supone que A ganaría 20% del mercado en perjuicio de B;
evidentemente, la publicidad en televisión parece ser más eficaz que servir refrescos. Ahora, por cada
una de las 9 combinaciones puede determinar ganancias o pérdidas del mercado para A.

Estrategias m a x i m í n y m i n i m a x

El enfoque conservador a la lección de la mejor estrategia es suponer lo peor y actuar de


conformidad con ello. Así según este enfoque y con referencia en la matriz de pagos. Si A decide sobre
la estrategia al, supondría que B escogerá la estrategia b2, reduciendo con ello el pago al para Aun
valor mínimo o de seguridad de -11. Análogamente, los valores de seguridad para a2 y a3 son - 8 y - 3,
respectivamente.

Obsérvese que los valores de seguridad para los distintos movimientos que puede hacer A son los
mínimos de filas. Dados estos valores mínimos, hará bien en emplear aquella estrategia que da el
máximo de estos valores de seguridad mínimos. En el ejemplo A debe adoptar a2 y aspira a un pago de
- 8 a B. Esta regla de decisión, que conduce a la elección del mayor de los valores mínimos en que
puede resultan cada estrategia, se llama estrategia maximín.

La compañía B, según esta actitud conservadora, supondría que por cada una de sus acciones, la
respuesta de A será tal que la ganancia de A en parte del mercado es la máxima posible. Por ejemplo,
si B emplea la estrategia bl, supondría que A adoptará la estrategia a3, la cual dará la peor pérdida
posible para B. Análogamente, los peores pagos para b2 y b3 son - 8 y -1, los máximos valores en las
columnas 2 y 3, respectivamente. Así, vemos que el máximo en cada columna es el peor pago por un
movimiento correspondiente hecho por B. El mejor de estos peores pagos es claramente el valor
mínimo de estas cifras más altas. Esta cifra - 8 en la columna 2, correspondiente a la estrategia b2 y el
movimiento contrario a2. Por tanto, la emisión óptima, llamada estrategia minimax de B, es b2.

Se puede observar según la regla maximín de A y la regla minimax de B el pago es - 8. Esta


cantidad se llama valor del juego es positivo, se dice que el juego es a favor de A: si negativo, favorece
a B; y si cero, se dice que el juego es equitativo. La solución de nuestro problema da un pago de - 8, que
indica que el juego favorece a B porque B gana 8% del mercado a expensas de A.

Punto d e silla d e montar

Se ha alcanzado ahora un punto en el que si A adopta estrategia maximin a2 su pago es exactamente


igual al que B espera que obtenga A si B emplea la estrategia minimax b2. Un lector puede poner en
duda el acierto de tales reglas de decisión. Por ejemplo, ¿ por qué Ano se esfuerza por ganar 20% de
la parte del mercado empleando a3, en vez de perder 8% a favor de B empleando a2? La respuesta es
que si A lo hiciera así B podría tomar b2 por lo que Apodría perder 10% a 13% del mercado a favor de
B, en vez de perder sólo 8%.

520
Similarmente, se puede argumentar que B debe adoptar b2 por lo que A podría perder 10% o 13%
del mercado a favor de B, a expensas de A. Sin embargo, este pago sólo es posible si A hace el
movimiento de a3.

En otro caso, la ganancia de B sería menor de 8. Argumentos similares usados en la "cautela"


dictan que a2 y b2 son las mejores estrategias para A en B respectivamente, porque esta combinación
ofrece a A y B una medida de seguridad. Esto es así porque el criterio de decisión maximín de A da a
A la "máxima" parte del mercado que puede impedirse a B que reduzca más y que la regla minimáx de
B ofrece B la "mínima" parte del mercado que puede impedirse a A que aumente más.

En otras palabras, las estrategias maximín y minimax conducen a los dos participantes del juego
a situaciones en las que ningún jugador tiene razón o incentivo alguno para cambiar su posición. A no
desea cambiar porque cuando B juega b2, él se encuentra mejor jugando a2 que al o a3. B no desea
cambiar porque cuando A juega a2 se encuentra mejor jugando b2 que bl o b3.

Evidentemente, se ha alcanzado una situación de equilibrio.

El pago en tal punto de equilibrio es la solución minimax y se conoce como punto de silla de
montar de la matriz de pagos en el sentido de que es el mínimo de sus datos de columna. Consideremos
la solución del par de decisiones en nuestro ejemplo a2 y b2. Cuando A adopte a2 el pago se reduce de
9 a - 8 y luego aumenta de - 8 a - 6. Cuando B escoge b2, su pago disminuye de - 11 a - 8 y luego
aumenta de - 8 a - 10. El número - 8 en medio forma un valle cuando es visto desde la segunda fila,
forma una cordillera cuando es visto desde la segunda columna. La solución minimax semeja
exactamente una silla de montar: de ahí el nombre de "punto en silla de montar", que es a la vez un
mínimo, como un valle máximo, como una cordillera.

Es posible que pueda haber más de un punto en silla de montar en la matriz de pagos de un juego.
Si es así, los pagos correspondientes a los puntos en silla de montar son empleados para determinar
movimientos óptimos para los dos jugadores, se puede considerar el siguiente juego, por ejemplo:

Estrategia de B

Aquí se tienen dos puntos en silla de montar; uno corresponde a a2 y bl, y el otro corresponde a
a2 y b2. Según el criterio minimax, el jugador A haría el movimiento a2. Al hacerlo, no importa si el
jugador B emplea la estrategia bl o b2, porque en cada caso B debe pagar a A una cantidad de, por
ejemplo, 5 útiles.

También, puesto que el valor del juego en este ejemplo es positivo, se dice que el juego favorece A.

Se dice que un juego de suma cero de dos personas es rigurosamente determinado si existe un
punto en silla de montar, porque ese punto es una solución aceptada al juego de encontrar la mejor
estrategia para cada uno de los dos jugadores.

Estrategia dominante:

Se dice que un jugador posee una estrategia dominante si una estrategia particular es preferida a

521
cualquier otra estrategia a disposición de él. Es posible que cada uno de los dos jugadores tenga
estrategia dominante.

Estrategia mixta:

Es una combinación de dos estrategias escogidas al azar, una cada vez, según determinadas
probabilidades, en contraste con una estrategia pura que no contiene tales elementos de azar.

Conclusiones

La Teoría de Juegos consiste en razonamientos circulares, los cuales no pueden ser evitados al
considerar cuestiones estratégicas. La intuición no educada no es muy fiable en situaciones estratégicas,
razón por la que se debe entrenar. La Teoría de Juegos fue creada por Von Neumann y Morgenstern
en 1944. Otros habían anticipado algunas ideas. Los economistas Cournot y Edgeworth fueron
particularmente innovadores en el siglo XIX.

Otras contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo.

A principio de los años cincuenta, en una serie de artículos muy famosa, el matemático John Nash
rompió dos de las barreras que Von Neumann y Morgenstern se habían auto-impuesto.

EJERCICIOS RESUELTOS

I • Mostrar dedos

Dos jugadores muestran simultáneamente uno, dos o tres dedos. Dos dedos vencen a uno, tres
a dos y uno a tres; en los demás casos hay empate. El jugador que vence recibe del otro una
cantidad en pesos igual al número de dedos mostrados en total (suma de los dedos mostrados
por a m b o s jugadores). ¿ C u á l es el valor del juego y las estrategias óptimas?

SOLUCIÓN

La matriz del juego es:

1 2 3

1 0
4

2 3 0 - 5

3 - 4 5 0

522
C o m p r o b a m o s si hay estrategias dominadas y vemos que no hay ninguna. Máx i mín ¡ A¡¡ = - 3;

Mín i máx i A¡¡ = 3 , por lo que no hay punto de silla.

En principio hay que resolver un programa lineal, por ejemplo, el correspondiente al primer
jugador:

Máx V

Sujeta a:

o x . + 3 X 2 - 4X3 > V
- 3 X] + 0X 2 + 5X3 > V
4X, - 5X 2 + 0X3 > V
Xi + X2 + X3 = 1
Xi, x2!/ X3 > 0

En este caso, sin e m b a r g o , se trata de un juego simétrico, la matriz es igual a su traspuesta


c a m b i a d a de signo (A = - A'), es decir, si permutamos los jugadores queda el mismo juego. Esto
significa que ningún jugador tiene ventaja sobre el otro ( V = 0) y sus estrategias son idénticas.
Ello permite simplificar la resolución numérica del juego; puesto que se sabe que V = 0 la
incógnita reside en qué estrategias son activas y, por lo tanto, en qué restricciones se cumplen
como igualdades.

Si las tres estrategias son activas, el sistema de ecuaciones es:

3 - 4 X3 = 0 El anterior sistema de ecuaciones nos d a como solución:


-3 X, + 5 X 3 = 0 X, = 5 / 1 2 ; X 2 = 1/3; X 3 = 1/4
4 X, - 5 X 2 =0
X, + x2 + x3 = 1

X i , X2/ X 3 > o

Luego la solución es:

x ; = Y; = 5/12 =0,410

X;=Y 2 * = 1 / 3 =0,3
X;=Y3*=L/4 =0,25
V* = 0

2 . Elecciones

D o s políticos (Horacín y Alavaro) representantes de dos partidos políticos de Locombia se


encuentran a dos días de finalizar la c a m p a ñ a para las elecciones generales. Se espera que
estos días sean cruciales debido a como se ha desarrollado la campaña y según la información
de las encuestas. Por lo tanto, ambos quieren emplear estos dos días para hacer c a m p a ñ a en
Mi y/o en M 2 .

523

Vous aimerez peut-être aussi