Vous êtes sur la page 1sur 32

INTRODUÇÃO À PESQUISA

OPERACIONAL

** Decisão com Incerteza – Parte 1 **

Profa. Vitória Pureza


2º Semestre
Roteiro
• Critérios de Decisão em Situações de Incerteza
• Teoria de Utilidade
• Axiomas de Von Neumann-Morgenstern
• Relação entre a Função de Utilidade e a Atitude em
relação ao Risco

Winston, cap. 13
Decisões em Situações com Incerteza
• Nestas situações, considera-se que um tomador de decisão
primeiro escolhe uma ação ai de um conjunto A={a1, a2, ..., ak}
de ações disponíveis

• O estado do sistema é então observado; com probabilidade pj,


o estado do sistema é sj  S={s1, s2, ..., sn}

• Se a ação ai tiver sido escolhida e o estado do sistema é sj, o


tomador de decisão recebe uma recompensa rij. Este modelo
é chamado de modelo de tomada de decisões do estado do
sistema
Critérios de Decisão em Situações de
Incerteza
Exemplo de modelo de estados do sistema
• Um vendedor de jornais vende jornais na esquina de 2 avenidas, e a
cada dia ele precisa determinar quantos jornais devem ser
vendidos. O vendedor paga $0,20 por cada jornal e vende cada um
deles por $0,25. Jornais não vendidos no fim do dia são
descartados. O vendedor sabe que cada dia ele pode vender entre
6 e 10 jornais com probabilidade uniforme
Neste exemplo:
– S={6, 7, 8, 9, 10} e pi=1/5, para todo i={6, 7, 8, 9, 10}
– O vendedor precisa escolher uma ação (número de jornais a
comprar a cada dia) do conjunto A={6, 7, 8, 9, 10}
Note que se o vendedor faz um pedido de i jornais e j jornais são
demandados, então:
– i jornais são comprados a um custo de $0,20
– Min(i,j) jornais são vendidos a um preço de $0,25 (ele pode ter
comprado menos jornais do que o demandado, ou seja, i < j)

Portanto, se o vendedor faz um pedidos de i jornais e j jornais são


demandados, ele obtém uma recompensa ou lucro líquido de rij, tal
que:
rij = 0,25i – 0,20i = 0,05i ( i  j)
rij = 0,25j – 0,20i ( i  j)
Valores de rij para cada valor de i e j
PEDIDO DE JORNAIS JORNAIS DEMANDADOS (ESTADO)
(AÇÃO) 6 7 8 9 10
6 0,30 0,30 0,30 0,30 0,30
7 0,10 0,35 0,35 0,35 0,35
8 -0,10 0,15 0,40 0,40 0,40
9 -0,30 -0,05 0,20 0,45 0,45
10 -0,50 -0,25 0 0,25 0,50

• Não foi considerada a possibilidade do vendedor pedir 1,2,...,5 jornais ou mais


de 10 jornais A razão disso é que estas ações são dominadas pelas ações de
pedidos de 6, 7,...,10 jornais
• Uma ação ai é dominada por uma ação ai’ se para todo sj  S, rij  ri’j, e para
algum estado sj’, rij’ < ri’j’
• Se uma ação ai é dominada, então em nenhum estado do sistema, ai será
melhor que ai’, e em pelo menos um estado do sistema, ai é inferior a ai’ (ai
sempre seria uma escolha melhor)
Se o vendedor pedir 1, 2,..., 5 jornais, ele obterá um lucro
(qualquer que seja o estado do sistema) de $0,05i
• Ou seja, na melhor das hipóteses (5 jornais), terá um lucro de
$0,25
• Pela tabela da recompensa, vemos que para i=1, 2,..., 5, o
pedido de 6 jornais domina pedidos de i jornais, pois se
consegue um lucro mínimo de $0,30
• Da mesma forma, fazer um pedido de i jornais (i > 11) é
dominado pelo pedido de 10 jornais. Nenhuma das ações em
A={6, 7,..., 10} são dominadas
Portanto, o vendedor deve escolher sua ação do conjunto
A={6, 7, 8, 9,10}
Critérios para Escolha da Ação
1. MAXIMIN
Para cada ação, determine o pior resultado (menor recompensa). O
critério MAXIMIN escolhe a ação com o “melhor” pior resultado
(Max {MinjS rij}
RECOMPENSA NO PIOR
PEDIDO DE JORNAIS PIOR ESTADO DO SISTEMA
ESTADO
6 6, 7, 8, 9, 10 0,30
7 6 0,10
8 6 -0,10
9 6 -0,30
10 6 -0,50

O critério MAXIMIN recomenda o pedido de 6 jornais, uma vez que


ele assegura que pelo menos haverá uma recompensa de $0,30
Critérios para Escolha da Ação
2. MAXIMAX
Para cada ação determine o melhor resultado (maior recompensa).
O critério MAXIMAX escolhe a ação com o maior valor de MaxjS rij

ESTADO QUE RESULTA NO MELHOR RESULTADO


PEDIDO DE JORNAIS
MELHOR RESULTADO
6 6, 7, 8, 9, 10 0,30
7 7, 8, 9, 10 0,35
8 8, 9, 10 0,40
9 9, 10 0,45
10 10 0,50

O critério MAXIMAX recomenda o pedido de 10 jornais, uma vez


que no melhor estado, haverá uma recompensa de $0,50
Critérios para Escolha da Ação
3. MINIMAX ARREPENDIMENTO (L. J. Savage)
Este critério usa o conceito de custo de oportunidade para chegar
a uma decisão
• Para cada possível estado do sistema sj, encontre uma ação i*(j)
que maximize rij (ou seja, i*(j) é a melhor ação possível se o
estado do sistema for realmente sj)
• Para cada ação e estado sj, a perda de oportunidade (ou
arrependimento) para ai em sj é ri*(k), j - rij
Exemplo: Se j=7, a melhor decisão é pedir i*(7)=7 jornais, resultando em
um lucro de r77=7(0,25) – 7(0,20)= 0,35
Suponha que tenham sido pedidos 6 jornais. Como r67=6(0,25) – 6(0,20)=
0,30, a perda de oportunidade é 0,35 – 0,30 = 0,05. Em outras
palavras, ao escolhermos pedir 6 jornais, estaremos deixando de ganhar
0,05, caso a escolha ótima (i=7) tivesse sido feita
Matriz de arrependimento
JORNAIS DEMANDADOS (ESTADO)
PEDIDO DE JORNAIS
(AÇÃO) 6 7 8 9 10

6 0,30– 0,30=0 0,35–0,3= 0,05 0,40– 0,30=0,10 0,45-0,30=0,15 0,50-0,30=0,20

7 0,30– 0,10=0,20 0,35–0,35= 0 0,40– 0,35=0,05 0,45-0,35=0,10 0,50-0,35=0,15

8 0,30+ 0,10=0,40 0,35–0,15= 0,20 0,40– 0,40=0 0,45-0,40=0,05 0,50-0,40=0,10

9 0,30+0,30=0,60 0,35+0,5= 0,40 0,40– 0,20=0,20 0,45-0,45=0 0,50-0,45=0,05

10 0,30+0,50=0,80 0,35+0,25= 0,60 0,40– 0=0,40 0,45-0,25=0,20 0,50-0,50=0

Máximo arrependimento de cada ação


PEDIDO DE JORNAIS (AÇÃO) MÁXIMO ARREPENDIMENTO
6 0,20
7 0,20
8 0,40
9 0,60
10 0,80

MINIMAX ARREPENDIMENTO procura minimizar o desapontamento sobre o


que poderia ter sido obtido com a ação ótima. Portanto, seria recomendado
o pedido de 6 ou 7 jornais
Critérios para Escolha da Ação
4. VALOR ESPERADO
O VALOR ESPERADO escolhe a ação que resulta no maior valor
esperado de recompensa. Como pode ser visto na tabela abaixo,
este critério recomendaria o pedido de 6 ou 7 jornais

PEDIDO DE JORNAIS VALOR ESPERADO

6 1/5(0,30 + 0,30 + 0,30 + 0,30 + 0,30) = 0,30


7 1/5(0,10 + 0,35 + 0,35 + 0,35 + 0,35) = 0,30
8 1/5(-0,10 + 0,15 + 0,40 + 0,40 + 0,40) = 0,25
9 1/5(-0,30 + 0,05 + 0,20 + 0,45 + 0,45) = 0,15
10 1/5(-0,50 - 0,25 + 0 + 0,25 + 0,50) = 0
 Pizza Hut e Domino competem pelo mercado de pizzas. Cada empresa
precisa determinar simultaneamente se deve adotar uma campanha de
marketing de pequeno, médio ou grande porte. Pizza Hut acredita que
seja igualmente provável que Domino adote qualquer uma das
campanhas. Para cada possível ação de cada empresa, os lucros de Pizza
Hut são apresentados na tabela abaixo. Determine a campanha escolhida
por Pizza Hut considerando os critérios maximin, maximax, minimax
arrependimento, e valor esperado

Matriz de lucros (recompensas) de Pizza Hut


PORTE DA CAMPANHA DE DOMINO (ESTADO)
PORTE DA CAMPANHA
DE PIZZA HUT (AÇÃO) PEQUENO MÉDIO GRANDE

PEQUENO $6000 $5000 $2000


MÉDIO $5000 $6000 $1000
GRANDE $9000 $6000 $0
Os critérios discutidos aqui podem parecer razoáveis mas
muitas pessoas tomam decisões sem usar nenhum deles. Um
modelo de tomada de decisão individual – Modelo de
Utilidade de Von Neumann-Morgenstern – é discutido a
seguir
Teoria de Utilidade

• Considere uma situação na qual uma pessoa receberá uma


recompensa ri com probabilidade pi (i=1,2,...,n). Isto é
denotado de loteria(p1, r1; p2, r2; ..., pn, rn)

Uma loteria é geralmente representada por uma árvore na


qual cada ramo representa um resultado possível da loteria e
o número de cada ramo representa a probabilidade de que o
resultado ocorrerá. Portanto, a loteria (1/4,$500; ¾, $0) pode
ser denotada por:
1/4
$500

¾ $0
Suponha que tenhamos que escolher entre duas loterias (L1 e L2).
Com probabilidade 1, a loteria L1 resulta em $10.000:

1
L1 $10.000

A loteria L2 consiste em jogar uma moeda balanceada. Se a face


de cima for cara, recebe-se $30.000 e se for coroa, recebe-se $0:

½
$30.000
L2
½ $0

• L1 resulta em um ganho esperado de $10.000 e L2 resulta em um


ganho esperado de $15.000.
• Apesar de L2 ter um valor esperado maior que L1, a maioria
das pessoas prefeririam L1, porque ela oferece a garantia de
um retorno relativamente grande, enquanto L2 resulta em
uma chance substancial de um ganho igual a 0.

• Em resumo, a maioria das pessoas, prefeririam L1 pois ela


envolve menor risco ou incerteza que L2.

Nosso objetivo é determinar um método que uma pessoa


possa usar para escolher uma entre duas loterias. Considere:
• L1pL2: a pessoa prefere L1 a L2
• L2pL1: a pessoa prefere L2 a L1
• L1iL2: a pessoa é indiferente entre as duas loterias (as
loterias são equivalentes)
Método de Von-Neumann-Morgenstern

Considere que se deseje classificar as seguintes 4 loterias:


½
$30.000
1 L2
L1 $10.000 ½ $0

0.02
$10.000
L3 1 $0 L4
0.98 $500
1. Identifique o resultado mais favorável ($30.000) e o menos
favorável (-$10.000)
2. Para todos os outros possíveis resultados (r1=$10.000,
r2=$500 e r3=$0), determine a probabilidade pi tal que o
tomador de decisão seria indiferente entre duas loterias:

pi
$30.000
1
ri e
1- pi $10.000
Suponha que:
2a) Para r1=$10.000, o tomador de decisão seja indiferente
entre: 0,9
$30.000
1
$10.000 e
0,1 $10.000

2b) Para r2=$500, o tomador de decisão seja indiferente entre:


0,62
$30.000
1
$500 e
0,38 $10.000

2c) Para r2=$0, o tomador de decisão seja indiferente entre:


0,60
$30.000
1
$0 e
0,40 $10.000
3. Construa as loterias L’1, L’2, L’3 e L’4 tal que L’i i Li e cada L’i
envolva apenas o melhor ($30.000) e o pior (-$10.000)
possíveis resultados

De 2a) vemos que L1 i L’1, onde:


0,90
$30.000
L’1
0,10 $10.000

De 2c) vemos que L2 i L’’2, onde:

½ $30.000
0.60 $30.000
L’’2
½
0.40 -$10.000
L’’2 é uma loteria composta na qual com probabilidade ½
recebe-se $30.000 e com probabilidade ½, joga-se uma loteria
com 0,6 de probabilidade de se obter $30.000 e 0,4 de
probabilidade de se obter $10.000.

Uma loteria L é composta se para algum i, existe uma


probabilidade pi de que o ganho do tomador de decisão é de
jogar uma outra loteria L’. Se uma loteria não é composta, ela
é chamada de loteria simples.
Note que L’’2 é uma loteria que resulta em:
• Probabilidade 0,5 + 0,5(0,6) = 0,8 de se obter $30.000, e
• Probabilidade 0,4(0,5)=0,2 de se obter $10.000.

Portanto, L2 i L’’2 i L’2,, onde:


0,8 $30.000
L’2
0,2 $10.000

 Obtenha L’3 tal que L’3 i L3, e L’4 tal que L’4 i L4
 Como Li i L’i, pode-se classificar L1, L2, L3 e L4 classificando
L’1, L’2, L’3 e L’4

• Considere duas loterias cujos únicos possíveis resultados


sejam $30.000 ( o mais favorável) e $-10.000 ( o menos
favorável). O tomador de decisão precisa simplesmente
escolher a loteria com maior chance de ter o resultado mais
favorável

Aplicando este conceito de L’1 a L’4:


• Para L’1 = 0.9
• Para L’2 = 0.8
• Para L’3 = 0.6
• Para L’4 = 0.6076
Logo, L’1 p L’2 p L’4 p L’3
Descrição Formal do Método de Von-
Neumann-Morgenstern
A utilidade da recompensa ri (u(ri)) é o número qi tal que o tomador de
decisão é indiferente entre as seguintes duas loterias:

qi
Resultado mais favorável
1 ri e
1- qi
Resultado menos favorável

Esta definição força u(menos favorável)=0 e u(mais favorável)=1

Para o exemplo anterior, u($30.000)=1 e u(-$10.000)=0. Além disso


u($10.000)=0.9, u($500)=0.62 e u($0)=0.60. A especificação de u(ri)
para todos os resultados ri é chamada de função de utilidade do
tomador de decisão
Para uma dada loteria L = (p1, r1; p2, r2; ..., pn, rn), defina a utilidade esperada
da loteria L, E(U para L), por:
n
E (U para L)   p u (r )
i 1
i i

No nosso exemplo:
• E(U para L1) = 1.(0,9) = 0,9 E(U para L2) = 0,5.(1) + 0,5.(0,6) = 0,80
• E(U para L3) = 1.(0,6) = 0,6 E(U para L4) = 0,02.(0) + 0,98.(0,62) = 0,6076

Note que Li i L’i e que L’i resultou em uma probabilidade E(U para L) para
$30.000 e em uma probabilidade 1 - E(U para L) para -$10.000.
Assim, ao escolher entre as loterias L’1, L’2, L’3 e L’4 (ou equivalentemente
entre L1, L2, L3 e L4), pode-se escolher entre elas através dos critérios de
utilidade esperados:
• L1 p L2 se e somente se E(U para L1) > E(U para L2)
• L2 p L1 se e somente se E(U para L2) > E(U para L1)
• L1 i L2 se e somente se E(U para L1) = E(U para L2)
Axiomas de Von Neumann-Morgenstern
Von Neumann e Morgenstern provaram que se a preferência de uma pessoa
satisfaz os axiomas seguintes, ela pode escolher entre loterias usando o
critério da utilidade esperada

AXIOMA 1: AXIOMA DA ORDENAÇÃO COMPLETA


Para quaisquer duas recompensas r1 e r2, um dos seguintes precisa ser
verdadeiro: o tomador de decisão (1) prefere r1 a r2, (2) prefere r2 a r1, ou (3)
é indiferente entre r1 e r2. Além disso, se a pessoa prefere r1 a r2 e prefere r2 a
r3, então ela deve preferir r1 a r3 (transitividade das preferências)
Axiomas de Von Neumann-Morgenstern
AXIOMA 2: AXIOMA DA CONTINUIDADE
Se o tomador de decisão prefere r1 a r2 e prefere r2 a r3, então para algum c
(0 < c < 1), L1i L2, onde
c
r1
1 r2 e L2
L1
1- c
r3
Usamos o axioma da continuidade quando encontramos, por exemplo, que
L3 i L’3, onde

0.60 $30.000
1
L3 $0 L’3
0.40 -$10.000
Axiomas de Von Neumann-Morgenstern
AXIOMA 3: AXIOMA DA INDEPENDÊNCIA
Suponha que o tomador de decisão seja indiferente entre as recompensas r1
e r2. Seja r3 qualquer outra recompensa. Então para qualquer (0 < c< 1),
L1 i L2, onde
c c
r1 r2
L1 L2
1-c 1-c
r3 r3

L1 e L2 diferem apenas no fato de que L1 tem uma probabilidade c de gerar a


recompensa r1, enquanto L2 tem uma probabilidade c de resultar na
recompensa r2. Portanto, o axioma da independência implica que o tomador
de decisão vê uma chance c de r1 e uma chance c de r2 serem de valor
idêntico, e esta visão vale para todos os valores de c e r3
Axiomas de Von Neumann-Morgenstern
AXIOMA 3: AXIOMA DA INDEPENDÊNCIA
Aplicamos o axioma da independência quando concluímos que L2 i L’’2, onde

½ ½
$30.000 $30.000
0.60
L2 L’’2 $30.000
½ ½
$0
0.40
-$10.000
Axiomas de Von Neumann-Morgenstern
AXIOMA 4: AXIOMA DA PROBABILIDADE DESIGUAL
Suponha que o tomador de decisão prefere a recompensa r1 à recompensa
r2. Se duas loterias têm apenas r1 e r2 como possíveis resultados, ele
preferirá a loteria com a maior probabilidade de obter r1

Usamos o axioma da probabilidade desigual quando concluímos, por


exemplo, que L’1 era preferível a L’2 porque L’1 tinha uma chance de 0.9 para
$30.000 e L’2 tinha uma chance de 0.8 para $30.000
Axiomas de Von Neumann-Morgenstern
AXIOMA 5: AXIOMA DA LOTERIA COMPOSTA
Suponha que quando todos os possíveis resultados são considerados, uma
loteria composta L resulta (para i=1,2,...,n) em uma probabilidade pi de
receber uma recompensa ri. Então L i L’ , onde L’ é uma loteria simples

Por exemplo, considere a seguinte loteria composta:


0.60
$6
½
0.40 -$4
L
½ -$4

Então, P(-$4)=1/2 + ½*0.4 = 0.7 e P($6)=½*0.6 = 0.3


Assim, L i L’’ onde 0.7
-$4
L
0.3 -$6

Vous aimerez peut-être aussi