Vous êtes sur la page 1sur 15

TEORIA DE DECISIONES

UNIDAD IV DECISIONES BAJO RIESGO

UNIDAD V DECISIONES BAJO INCERTIDUMBRE

PROF: JOSE ALEXIS LAGOS VIVAS

4.1 Alternativas de decisión mediante distribuciones de probabilidad.

Criterio del valor esperado.

Arboles de decisión variantes del criterio del valor esperado.

4.2 Probabilidades posteriores. Funciones de utilidad.

5.1 Criterios de Laplace, Teoría de juegos, Suma cero, Criterio MiniMax, Criterio
Savage, Criterio Hurnicz

5.2 Estrategias: Estrategias Mezcladas juegos con programación lineal

TOMA DE DECISIONES EN CONDICIONES DE RIESGO

En condiciones de riesgo, los beneficios asociados con cada alternativa de


decisión están representados por distribuciones de probabilidad, y la decisión
puede basarse en el criterio de valor esperado, maximización de la utilidad
esperada o la minimización del costo esperado. En ocasiones, el criterio del valor
esperado se modifica para tener en cuenta otras situaciones.

Por lo que en esta categoría se incluyen las decisiones en las cuales las
consecuencias de una acción dada dependen de algún evento probabilista. Por lo
tanto son las decisiones que se toman con información parcial sobre el tema, es
decir que se dispone de información pero ésta no es del todo exacta y se tiene
probabilidades de ocurrencia, por tanto la elección que se tome, tendrá un riesgo
asociado.
Fuente de Errores en la Toma de
Decisiones:

La fuente principal de errores en


los problemas de toma de decisiones
arriesgadas son las presunciones
falsas, no tener una estimación
exacta de las probabilidades, depender de la expectativa, dificultades en medir la
función de utilidad, y los errores de pronóstico.

El proceso de decisión se describe a continuación:

 El problema está definido y todas las alternativas confiables han sido


consideradas. Se evalúan los resultados posibles para cada alternativa.

 Los resultados se discuten de acuerdo a su reembolso monetario o de


acuerdo a la ganancia neta en activos o con respecto al tiempo.

 Los valores inciertos son cuantificados en términos de probabilidad.

 La calidad de la estrategia óptima depende de la calidad con que se


juzgue.

 El tomador de decisiones deberá examinar e identificar la sensibilidad de


la estrategia optima con respecto a los factores cruciales.

Cuando el decisor posee algún conocimiento sobre los estados de la naturaleza


puede asignarle a la ocurrencia de cada estado alguna estimación subjetiva de
probabilidad. En estos casos, el problema se clasifica como de toma de
decisiones con riesgo. El decisor puede asignar probabilidades a la ocurrencia
de los estados de la naturaleza.

El proceso de toma de decisión con riesgo es el siguiente:

a) Use la información que tenga para asignar su parecer personal (llamado


probabilidades subjetivas) sobre el estado de la naturaleza, p(s); Use algunos
de los criterios visto antes.
b) Cada curso de acción tiene asociado un determinado beneficio con cada uno
de los estados de la naturaleza, X(a, s);

c) Calculamos el beneficio esperado, también llamado riesgo o R,


correspondiente a cada curso de acción como R(a) = Sumas de [X(a, s)* p(s)];

d) Aceptamos el principio que dice que deberíamos actuar para minimizar (o


maximizar) el beneficio esperado;

e) Ejecute la acción que minimice R(a).

De lo antes expuesto el valor esperado de cualquier variable aleatoria es el


promedio ponderado de todos los valores posibles de la variable aleatoria, donde
los coeficientes de ponderación son las probabilidades de que los valores ocurran.
Dado que a los diferentes rendimientos se asocian distintos estados de la
naturaleza, el rendimiento esperado asociado con la decisión i es la suma, en
todos los estados j posibles, de términos de la forma: (rendimiento en el estado j
cuando la decisión es i) multiplicado por (la probabilidad de ocurrencia del estado
j), o rij pj.. Entonces podemos utilizar la siguiente ecuación para calcular ERi, el
rendimiento esperado si seleccionamos la decisión i:

Para este tipo de modelo, la administración debe entonces tomar aquella


decisión que maximice el rendimiento esperado. En otras palabras, i* es la

decisión óptima cuando: ERi* = máximo de ERi para todo valor de i.

Ejemplo:

El modelo del repartidor de periódicos Un ejemplo de este tipo de modelo es el


siguiente modelo del repartidor de periódicos. Un repartidor de periódicos puede
comprar el Wall Street Journal a 40 centavos cada uno y venderlo a 75 centavos.
Sin embargo, debe adquirir los periódicos antes de saber cuántos puede vender
realmente. Si compra más periódicos de los que puede vender, simplemente
desechará el excedente, sin costo adicional. Si no compra suficientes periódicos,
pierde ventas potenciales ahora y posiblemente en el futuro (los clientes
disgustados podrían ya no comprarle). Suponga, por el momento, que esta
pérdida de ventas futuras es representada por un costo de pérdida del buen
nombre estimado en 50 centavos por cliente insatisfecho. Con propósitos
ilustrativos y para facilitar el cálculo, también suponga que la distribución de la
demanda que enfrenta es:

En este modelo, cada uno de los


cuatro diferentes valores de la
demanda es un estado de la
naturaleza diferente, y el número de
periódicos ordenados es la decisión.
Los rendimientos, o retribuciones, para este modelo se muestran en la tabla 10.4.
Las entradas de esta tabla representan el flujo de efectivo neto asociado con cada
combinación de cantidad ordenada y cantidad solicitada, menos el costo por la
pérdida de la buena reputación comercial (PBRC) —o también llamada “del buen
nombre”— cuando la cantidad ordenada no es suficiente para satisfacer la
demanda. Estas entradas se calculan mediante la expresión retribución = 75
(número de periódicos vendidos) - 40 (número de periódicos ordenados) - 50
(demanda no satisfecha).
Donde el precio de venta por periódico es de 75 centavos, el costo de comprar
un periódico es de 40 centavos y el costo por desilusionar a un cliente (el costo
PBRC) es de 50 centavos.

Una vez que todos los datos están reunidos en la tabla 10.4, el proceso para
encontrar la decisión óptima es estrictamente mecánico. Utilice la ecuación (10.1)
para evaluar el rendimiento esperado para cada decisión (ERi para i = 0, 1, 2, 3) y
escoja el más grande.

Dado que ER2 es el mayor de estos cuatro valores, la decisión óptima es ordenar
dos periódicos.

En las decisiones bajo incertidumbre otra vez tenemos más de un estado


posible de la naturaleza, pero ahora quien toma la decisión no quiere o no puede
especificar las probabilidades de que los diferentes estados de la naturaleza
ocurran. Hay una discusión eterna acerca de si una situación de este tipo debería
existir; esto es, ¿quién toma la decisión debería estar siempre dispuesto a
especificar las probabilidades, aunque sea de manera subjetiva, incluso cuando él
o ella no tengan mucha idea (o ninguna) de cuál estado de la naturaleza puede
ocurrir?

Para abordar esta situación se analizaran los siguientes criterios en ellos su


análisis también se basa en el planteamiento de una matriz de pagos, pero a
diferencia del Valor Esperado, las probabilidades de ocurrencia de los estados de
la naturaleza, son desconocidas.
Criterio de Laplace

El procedimiento del criterio de Laplace interpreta el estado de “incertidumbre”


como equivalente a suponer que todos los estados de la naturaleza son
igualmente probables.
Este punto de vista
podría resumirse como: “si nada sé, entonces todo es igualmente posible”, El
criterio de Laplace se basa en el principio de razón insuficiente. Ya que no se
conocen las distribuciones de probabilidad, no hay razón alguna para creer que las
probabilidades asociadas con los estados de la naturaleza sean diferentes. Por
tanto, las alternativas se evalúan utilizando la suposición simplificadora de que
todos los estados son igualmente probables de que ocurran; es decir,

Si la retribución v(ai, sj) representa la


ganancia, la mejor alternativa es la que da
por resultado:

Criterio MaxiMin

El criterio MaxiMin (MiniMax) es un procedimiento extremadamente


conservador, quizás pesimista, para tomar decisiones. Evalúa cada decisión
según la peor circunstancia que pudiera pasar si se tomara esa decisión. En este
caso, entonces, evalúa cada decisión según el rendimiento mínimo posible
asociado con la decisión. En el ejemplo del repartidor de periódicos, el rendimiento
mínimo posible si se ordenan 3 periódicos es de –120; por lo tanto, este valor es
asignado a la decisión de “ordenar 3 periódicos”.

De manera similar, cada una de las otras decisiones podemos asociarla con el
valor mínimo en su fila. Seguir esta regla le permite a quien toma la decisión
preparar una tabla como la 10.5. La decisión que proporciona el valor máximo de
los rendimientos mínimos (por lo tanto, MaxiMin) es entonces seleccionada. En
este caso, el repartidor de periódicos deberá pedir 1 periódico.
MaxiMin es utilizado
a menudo en
situaciones donde la
persona que planea
siente que no puede
permitirse un error. (La
planeación de la
defensa nacional puede ser un ejemplo, así como la inversión de los ahorros de
toda la vida.) Quien planea elige una decisión que hace lo mejor posible en el peor
(o más pesimista) caso posible.

En líneas generales se procede de la siguiente forma:

Desde un punto de vista optimista, se elige la opción que mejores resultados


brinde. En el caso de beneficios, se utiliza el MaxiMax, que representa el máximo
de los máximos y para costos, se utiliza el MiniMin, que significa el mínimo de los
mínimos.

• Desde un punto de vista pesimista, se elige la mejor opción de entre las


peores que podrían suceder. Para un problema de utilidades, el modelo adecuado
es el MaxiMin, es decir se elige el valor máximo de entre los mínimos y en el caso
de los costos es el MiniMax, que sugiere elegir el valor mínimo de entre los
máximos.

Ejemplo:

Supongamos que una empresa quiere realizar una campaña publicitaria. Se le


presentan 3 posibilidades: radio (15 minutos de lunes a jueves en un espacio), TV
(1 spot cada semana sobre las 12h) y prensa (1 anuncio 2 días a la semana los
lunes y los jueves). Como han hecho campañas anteriormente se han podido
valorar los beneficios de las diferentes posibilidades del siguiente modo:
¿Qué medio de comunicación se debería elegir?

Como la matriz de pagos es de utilidades, entonces se utilizarán los modelos


MaxiMax y MaxiMin

• Optimista: MaxiMax. De cada una de las alternativas de la matriz de decisión


(filas) se escoge el mayor valor, y de estos nuevamente se escoge el valor más
alto:

Pesimista: MaxiMin. De cada una de las alternativas de la matriz de decisión


(filas) se escoge el menor valor, y de estos se escoge el valor más alto:
Conclusión: Tomando en cuenta una actitud positiva, el medio más adecuado
para realizar la campaña publicitaria sería la radio. En el caso de los pesimistas, la
prensa sería el medio más seguro.

Para este ejemplo aplicando Laplace tenemos: se busca sacar el promedio de


todos los posibles resultados para cada alternativa. En el caso de utilidades, se
elige la alternativa que arroje el mayor valor y cuando la información es de costos,
se elegirá el menor.

Conclusión: Se
debería escoger la
radio para realizar la
campaña publicitaria.

Hurwicz

Este modelo también se ve afectado por la personalidad del decisor y parte de


tomar un coeficiente de optimismo a que puede variar entre 0 y 1, cuanto mayor el

valor de α, mayor optimismo (menor pesimismo); y a menor valor de α, mayor

pesimismo (menor optimismo).

Siguiendo con el ejercicio de los medios, a continuación se presenta la forma

de calcular el valor de cada alternativa tomando un α = 80% (Optimista) y otro

ejemplo tomando un α = 30% (pesimista):


Conclusión: Siendo optimistas (α = 80%) se debería trabajar con la radio. Pero

en el caso de una actitud pesimista (α = 30%), se debería optar por la prensa


para realizar la campaña publicitaria.

En otras palabras Hurwicz, está diseñado para representar diferentes actitudes


de decisión que van desde la más optimista hasta la más pesimista.

Defina, 0 <= α <= 1 . La acción seleccionada debe asociarse con

El parámetro α es el índice de optimismo. Si α=0, entonces el criterio se reduce


al criterio minimax conservador, que busca la mejor de las peores condiciones. Si

α = 1, entonces el criterio es optimista porque busca la mejor de las mejores

condiciones.

El grado de optimismo (o pesimismo) puede ajustarse seleccionando un valor

de α entre 0 y 1. Sin la fuerte sensación con respecto a un optimismo y a un

pesimismo extremos, α = 0.5 puede ser una elección justa.

Savage (Modelo del Arrepentimiento o Costo de Oportunidad).

Normalmente cuando un decisor se inclina por una opción y no se encuentra del


todo seguro, le llega un sentimiento de intranquilidad (arrepentimiento) por no
haber elegido alguna de las otras opciones, el criterio de Savage busca minimizar
el arrepentimiento y propone armar una nueva tabla, que se denomina de
arrepentimiento o de pérdidas, de donde se elegirá la opción que menores
pérdidas le pueda traer al decisor de entre las máximas que podrían ocurrir
(MiniMax).

Para armar la tabla, se elige de la matriz de pagos, la mejor opción de cada


columna, es decir en el caso de utilidades, se elegirá el valor más alto y se lo resta
de toda la columna y en el caso de costos se elegirá el valor más bajo y se resta la
columna de este valor. De esta manera se genera una nueva tabla de pérdidas en
donde se aplica el criterio MiniMax para elegir la mejor alternativa.

Retomando nuevamente el ejercicio de los medios, la matriz de pérdidas se


calcula de la siguiente manera:

Restando cada valor de la columna que le corresponde:

Aplicando el criterio MiniMax:

Conclusión: La alternativa
que menor arrepentimiento nos
traería así como las menores
pérdidas es la radio.
Otro ejemplo:

National Outdoors School (NOS) está preparando un sitio para acampar en el


verano en el corazón de Alaska para enseñar técnicas de sobrevivencia en áreas
salvajes. NOS estima que la asistencia puede caer dentro de una de cuatro
categorías: 200, 250, 300 y 350 personas. El costo del campamento será mínimo
cuando su tamaño satisfaga la demanda con exactitud. Las desviaciones por
encima y por debajo de los niveles de demanda ideales incurren en costos
adicionales por construir más capacidad
que la necesaria o por perder
oportunidades de ingresos cuando la
demanda no se satisface. Si a1 a a4
representan los tamaños de los
campamentos (200, 250, 300 y 350
personas) y s1 a s4 el nivel de
asistencia, la siguiente tabla resume la
matriz de costos (en miles de dólares)
para la situación.

El problema se analiza aplicando los cuatro criterios.

Laplace. Dado que P {sj} = ¼*, j = 1 a 4, los valores esperados con las
diferentes acciones se calculan como

E{a4} =1/4*(30 + 22 + 19 + 15) = $21,500

E{a3} =1/4*(21 + 18 + 12 + 21) = $18,000

E{a2} =1/4*(8 + 7 + 12 + 23) = $12,500 ; Óptimo

E{a1} =1/4*(5 + 10 + 18 + 25) = $14,500

MiniMax. El criterio MiniMax produce la siguiente matriz:


Savage. La matriz de arrepentimiento se determina restando 5, 7, 12 y 15 de las
columnas 1 a 4, respectivamente. Por lo tanto,

Hurwicz. La siguiente tabla resume los cálculos.

Utilizando una α apropiada podemos determinar la alternativa óptima. Por

ejemplo, en α= 0,5, a1 o a2 es la óptima, y en α = 0,25, a3 es la óptima.


Ejercicios:

1. Hank es un estudiante inteligente y suele obtener buenas calificaciones,


siempre que pueda repasar el material del curso la noche anterior al examen.
Para el examen de mañana, Hank enfrenta un pequeño problema. Sus hermanos
de fraternidad van a tener una fiesta que va a durar toda la noche, y a la cual le
gustaría asistir. Hank tiene tres opciones:

a1 = Parrandear toda la noche

a2 = Dividir la noche en partes iguales entre estudiar y participar en la fiesta

a3 = Estudiar toda la noche

El examen de mañana puede ser fácil (s1), moderado (s2), o difícil (s3),
dependiendo del impredecible humor del profesor. Hank anticipa las siguientes
calificaciones:

(a) Recomiende un curso de acción para


Hank (basado en cada uno de los cuatro
criterios de decisión bajo incertidumbre).

(b) Suponga que a Hank le interesa más la


calificación que obtendrá. Las calificaciones
aprobatorias que van de la A a la D, son 90, 80,
70 y 60, respectivamente. ¿Exigiría esta actitud
hacia las calificaciones un cambio del curso de
acción de Hank?

2. Para la temporada de siembra venidera, Farmer McCoy puede sembrar maíz


(a1), trigo (a2), o soya (a3), o utilizar el terreno para pastoreo (a4). Las
retribuciones asociadas con las diferentes acciones dependen de la cantidad de
lluvia: lluvia fuerte (s1), lluvia moderada (s2), lluvia ligera (s3), o sequía (s4). La
matriz de retribuciones (en miles de dólares) se estima como
Desarrolle un curso de acción para
Farmer McCoy basado en cada una de
las cuatro decisiones bajo criterios de
incertidumbre.

3. Hay que seleccionar una de N máquinas para fabricar Q unidades de un


producto específico. Las demandas mínima y máxima del producto son Q* y Q**,
respectivamente.

El costo de producción total de Q artículos con la máquina i implica un costo fijo


Ki y un costo variable por unidad ci, y está dado como

(a) Idee una solución para el


problema conforme a cada uno de los
cuatro criterios de decisión bajo
incertidumbre.

(b) Con 1000<= Q <= 4000 y el


siguiente conjunto de datos, resuelva el
problema:

Fin de la unidad IV Y V.

Vous aimerez peut-être aussi