Vous êtes sur la page 1sur 20

por Fernando Barrichelo

Cap. 4 - Entenda o mecanismo da cooperao (A cincia do conflito) O que o Dilema dos Prisioneiros
Quando o "equilibrio" ineficiente na Teoria dos Jogos
O Dilema dos Prisioneiros um jogo muito famoso que representa bem o dilema entre cooperar e trair
[NOTA 1].

Resumidamente, a estria a seguinte. Dois

suspeitos, A e B, so presos pela polcia. A polcia no tem provas suficientes para os condenar, ento separa os prisioneiros em salas diferentes e oferece a ambos o mesmo acordo: 1. Se um dos prisioneiros confessar (trair o outro) e o outro permanecer em silncio, o que confessou sai livre enquanto o cmplice silencioso cumpre 10 anos. 2. Se ambos ficarem em silncio (colaborarem um com ou outro), a polcia s pode conden-los a 1 ano cada um. 3. Se ambos confessarem (trarem o comparsa), cada um leva 5 anos de cadeia. Cada prisioneiro faz a deciso sem saber a escolha do outro - eles no podem conversar. Como o prisioneiro vai reagir? Existe algum deciso racional a tomar? Qual seria a sua deciso? Usando uma matriz como recurso visual Uma forma esquemtica para mostrar uma interao humana, ou seja, um jogo, atravs de uma "matriz de resultados"
[NOTA 2].

Embora o enunciado do problema seja simples e intuitivo para entender de forma verbal, a representao grfica

oferece uma grande ajuda para visualizar o cenrio de forma completa e entender as opes e implicaes para cada jogador.

Nesta figura voc visualiza as duas opes de cada prisioneiro e o resultado de cada combinao de ao. Para cada clula, os valores vermelhos a direita referem-se ao Prisioneiro A; os azuis a esquerda referem-se ao Prisioneiro B. Esto descritos quantos anos cada prisioneiro ficar na cadeia. Neste cenrio, quando menor o valor da pena, melhor para o prisioneiro. Os prisioneiros no podem combinar a deciso (esto em salas isoladas e sem comunicao) e devem escolher simultaneamente. Cada jogador quer ficar preso o menor tempo possvel, ou seja, maximizar seu resultado individual. Qual a melhor deciso? Considerando os incentivos deste jogo (os valores das penas para cada combinao de decises na matriz), existe uma nica deciso racional a tomar: trair. A explicao a seguinte: Imagine que voc o prisioneiro A. Assim, voc raciocina nas duas hipteses: - Suponha que o Prisioneiro B escolha Colaborar. Ento, se voc escolher Colaborar, leva 1 ano de priso. Se escolher Trair, sai livre. Neste caso, Trair a melhor opo. - Suponha que o Prisioneiro B escolha Trair. Ento, se voc escolher Colaborar, leva 10 anos de priso. Se escolher Trair, fica com 5 anos. Neste caso, Trair a melhor opo. Perceba que Trair a melhor opo em ambos os casos. Em outras palavras, Trair a melhor opo independente da deciso do Prisoneiro B. Agora, imagine o que o Prisoneiro B est pensando: se ele racional como voc, provavelmente a mesma coisa. - Ele supe que voc vai escolher Colaborar. Ento, se ele escolher Colaborar, leva 1 ano de priso. Se escolher Trair, sai livre. Neste caso, Trair a melhor opo. - Ele supe que voc vai escolher Trair. Ento, se ele escolher Colaborar, leva 10 anos de priso. Se escolher Trair, fica com 5 anos de priso. Neste caso, Trair a melhor opo. De novo, perceba que Trair a melhor opo em ambos os casos. O dilema: a escolha individual no o melhor para ambos Em Teoria dos Jogos, chamamos que Trair a Estratgia Dominante, ou seja, aquela que apresenta o melhor resultado independente da deciso do outro jogador. Quando em um certo jogo, devido o esquema de incentivos (a matriz de resultados) voc no precisa se preocupar com a deciso alheia porque existe uma opo melhor independente do seu competidor, ento voc deve escolher a estratgia dominante. Neste exemplo dos prisioneiros, como ambos vo escolher Trair devido a estratgia dominante, cada um preso por 5 anos. Assim, dizemos que Trair-Trair a soluo de equilbrio, equilibrio do jogo ou Equilibrio de Nash. O Equilibrio de Nash

[NOTA 3]

a soluo (combinao de decises) em que nenhum jogador pode melhorar seu resultado com uma ao

unilateral. Ou seja, dado que Trair-Trair a soluo de equilbrio (o resultado racional do jogo), se o Prisioneiro A mudar unilateralmente para Colaborar ele sai perdendo (15 anos), o mesmo ocorrendo para o Prisioneiro B. O grande problema no Dilema dos Prisioneiros que o equilbrio (Trair-Trair) no o melhor resultado pois existe um outro possivel e melhor: se ambos escolherem Colaborar (ficar em silncio) cada um ficaria com apenas um ano de priso. Assim, o Dilema dos Prisioneiros uma abstrao de situaes comuns onde a escolha do melhor individual conduz traio mtua, enquanto que a colaborao proporcionaria melhores resultados. Por isso dizemos que o Dilema dos Prisioneiros resulta em um "equilbrio ineficiente" pois o esquema de incentivos e racionalidade induz a um resultado pior. Voc poderia imaginar que este equilbrio s ocorre porque as pessoas no podem conversar e combinar as aes, e que se pudessem fazer um acordo prvio, tudo se resolveria. Isso no necessariamente verdade. Voc quer colaborar (ficar em silncio), mas quem garante que o seu parceiro far o mesmo? O quanto voc confia no outro jogador? Voc o prisioneiro e sua vida est em jogo. Voc combina antes que vai colaborar e quer cumprir sua palavra. Seu comparsa sabe isso. Ento, o que garante que, no ltimo instante, ele no vai te trair, justamente sabendo que voc vai colaborar? Para ele simples, ele sai livre e voc pega 15 anos de priso... Da tarde. Provalvelmente, o seu comparsa pensar da mesma forma a seu respeito. Por isso, o Dilema dos Prisioneiros se torna, na verdade, num Dilema da Confiana. Como resolver esse dilema? Voc ver nos prximos artigos.
[1] O Dilema dos Prisioneiros foi inventado em 1950 por Merrill Flood e Melvin Dresher, e foi adaptado e divulgado por A.W.Tucker. [2] Em ingls, o termo usado "payoff matrix". Em portugus existem algumas variantes: matriz de resultados, matriz de recompensas e matriz de pagamentos. [3] O nome Equilibrio de Nash devido seu inventor, John Nash, ganhador do prmio Nobel em 1994 e que foi retratado no filme Uma Mente Brilhante, em 2001.

O Dilema dos Prisioneiros na vida real - Guerra de Preos


[OBS: para melhor aproveitar este artigo, sugiro primeiro ler o O que o Dilema dos Prisioneiros como introduo] O maravilhoso mundo do Dilema dos Prisioneiros abre as portas para muitas analogias com a vida real. Este "jogo-modelo" uma das metforas mais poderosas na cincia do comportamento humano pois inmeras interaes sociais e econmicas tem a mesma estrutura de incentivos (a matriz de resultados). O conflito tpico dos jogos da categoria "Dilema dos Prisioneiros" que cada jogador escolhe sua estratgia dominante e o resultado pior ao grupo como um todo; o conflito entre o interesse individual e coletivo. O exemplo do Posto de Gasolina e a Guerra de Preos Imagine uma cidade com apenas dois postos de gasolina. Voc dono de um deles, chamado GASOIL, que fica lado a lado do seu concorrente, o posto CARGAS. Devido a proximidade, quando uma pessoa precisa abastecer o carro, ela vai at eles, visualiza o preo de ambos e escolhe pelo menor. Embora existam outros motivos que diferenciam os postos, como a cordialidade e velocidade dos frentistas, o preo o fator mais relevante. Assim, se o assunto preo, alguns centavos a menos podem induzir parte dos clientes a preferir o posto com menor valor. Por exemplo, se seu concorrente abaixar o preo em 5%, ele ganha cerca de 30% dos seus clientes. Este aumento de volume de clientes compensa o preo reduzido, melhorando a rentabilidade, enquanto voc perde faturamento. Por isso,

voc pensa: que tal abaixar o preo do litro de $3 para $2,90? Isso far com que habituais clientes do CARGAS (concorrente) passem a abastecer no GASOIL (o seu posto). A vida empresarial seria mais fcil se as decises foram isoladas. Entretanto, como o seu concorrente vai reagir? Ao notar que voc abaixou o preo e ele perdeu clientes, ele tambm vai abaixar o preo para $2,90. Como resultado, os dois postos tero preo igual ($2,90 no lugar de $3,) e o mesmo volume de cliente como antes, mas ambas empresas perdem faturamento e lucro. Essa a essncia de uma guerra de preos que prejudica o negcio dos dois postos. Suponha que vocs tomam a deciso simultaneamente. Se hoje domingo, vocs vo decidir qual o preo inicial na segunda-feira. Durante o dia no possvel alterar o preo, apenas de um dia para outro. Vocs no se conversam e no sabem qual preo o concorrente vai adotar. Voc fica sabendo apenas no dia seguinte e qualquer arrependimento ser tarde demais (ao menos durante um dia inteiro, at voc tomar alguma atitude para o dia seguinte). Considerando essa dinmica de mercado com clientes sensveis ao preo, ambos tem incentivos para abaixar o preo e ganhar mais momentaneamente. Entretanto, se os dois fizerem, ambos saem perdendo. Assim, preventivamente, voc conversa com o dono do CARGAS e combinam de no abaixar os preos. Ele concorda, mas voc vai dormir com a dvida: ser que posso confiar nele? Se ele abaixar o preo a noite, voc perder toda a clientela do dia seguinte. Voc est num dilema - o Dilema da Confiana, ou melhor dizendo, um jogo semelhante ao Dilema dos Prisioneiros. Matriz de Resultados possui a mesma armadilha dos Prisioneiros Embora seja intuitivo, podemos representar a matriz de resultados do posto de gasolina abaixo. Em cada clula (combinao de escolhas), o valor da esquerda refere-se os ganhos do Gasoil, e o valor a direita so os ganhos da Cargas. O valor em si meramente ilustrativo, mas a proporo entre eles que relevante para a deciso.

CARGAS Manter Reduzir GASOIL Manter Reduzir 50 , 50 60 , 30 30 , 60 40 , 40

Se ambos colaborarem, os dois ganham $50 por dia. Se um deles abaixar o preo, recebe $60 enquanto o que mantem reduz para com $30. J se ambos reduzirem o preo, o resultado para cada um ser $40, pois significa abaixar o preo sem aumentar volume de clientes. Como visto na metodologia de anlise no Dilema do Prisioneiro, (40,40) o ponto de equilbrio (reduzir-reduzir) pois abaixar o preo a estratgia dominante de cada um, resultando em pior valor se tivessem mantido o preo. Eles caram na armadilha e muitos chamam essas situaes de Dilema Social - o interesse individual e anlise estritamente matemtica e racional induz a resultados piores do que outras opes olhando o coletivo. Como mencionado, difcil sair dessa armadilha - quem vai arriscar a colaborar (manter o preo) se h chance do outro trair (reduzir o preo) e ganhar sozinho? O prximo exemplo refere-se ao dilema da propaganda visual na cidade de So Paulo e a soluo da lei Cidade Limpa.

Cooperao via Autoridade Central: exemplo da Lei Cidade Limpa


[OBS: para melhor aproveitar este artigo, sugiro primeiro ler o O que o Dilema dos Prisioneiros como introduo] Como resolver o Dilema dos Prisioneiros? Como conseguir a cooperao quando os incentivos induzem as pessoas para o egosmo e individualismo, mesmo sabendo que no final todos perdem? Uma das respostas o uso de uma autoridade central que force os jogadores a colaborarem, sob pena de alguma sanso. o que ocorreu com a Lei Cidade Limpa, em So Paulo, vlida desde 2007. Antes da lei, existia na cidade era uma verdadeira guerra de propaganda visual, um tpico dilema dos prisioneiro. Para serem vistos, os comerciantes cada vez mais colocavam letreiros maiores em suas lojas. Como consequncia, ningum via nada, a logomarca sequer era notada e gerava uma poluio visual enorme. Assim, ningum saia lucrando (apenas empresas de letreiros...) Uma forma de converter esse esquema numa matriz de resultados a seguinte:

Se as empresas no entrassem na guerra do "o meu maior e mais luminoso", todos estariam OK (quadrante esquerdo superior - manter logo). Entretanto, a tentao era muito grande para se aproveitar: se a LOJA 2 aumentar seu letreiro, o seu logo vai aparecer "muito" e da LOJA 1 "nada" pois o grande ofusca o pequeno. O inverso ocorre se LOJA 2 aumentar e LOJA 1 manter o seu logo. O final voc j sabe... se ambas aumentarem o tamanho do logo, todos aparecem "pouco". Embora seja uma representao aproximada (Ok, muito, nada, pouco), o esquema demonstra a essncia deste jogo. Existe uma estratgia dominante para aumentar o logo, uma vez que "muito" melhor que "Ok", e "pouco" melhor que "nada". Como resposta a esse dilema, a prefeitura de So Paulo limitou o tamanho dos letreiros de cada loja para 4 m2 e at 5m de altura. Essas dimenses pode ser questionada do ponto de vista arquitetnico, entretanto, como poltica pblica para combater a poluio visual e terminar a guerra entre as lojas (Dilema dos Prisioneiros), a lei bem eficaz pois os jogadores (as lojas) no conseguiam entrar em cooperao por si prprios. Afinal, eles estavam numa armadilha e no sabiam sair

dela. Se voc tem uma loja e decide manter o logo, quem garante que seu vizinho no vai aumentar o dele? E se ele aumentar, ofuscando o seu, o que voc far? Outro exemplo: quando os governos proibiram a propaganda de cigarro, em vrios pases, muitos acharam que seria o fim da indstria do tabaco. Mas no foi o que ocorreu. As empresas tambm estavam num Dilema dos Prisioneiros, presos a armadilha de gastar fortunas em propaganda. As campanhas publicitrias eram caras e ostensivas, mas o propsito era defensivo - as empresas faziam campanhas porque as demais faziam. O exemplo similar ao nossos caso do posto de gasolina; se uma empresa deixasse de fazer propaganda, dado o investimento da outra, os clientes poderiam migrar de marca e transferir o lucro. No fim, a restrio da propaganda ajudou as empresas a evitar campanhas milionrias; embora sem este artifcio para atingir o pblico, no perderam lucratividade pois os custos diminuram. Tanto no caso da lei Cidade Limpa, como na propaganda de cigarro ou no aumento/reduo de preos, os jogadores (empresas, indivduos) at agradecem uma autoridade central que as force um acordo coletivo que limite a competio e canibalismo.

Cooperao via estratgia Olho por Olho


[OBS: para melhor aproveitar este artigo, sugiro primeiro ler o O que o Dilema dos Prisioneiros como introduo] Em que condies a cooperao surgir num mundo de egostas sem uma autoridade central? Essa foi uma das questes que Robert Axelrod trabalhou para elaborar um estudo que resultou no livro The Evolution of Cooperation. [NOTA 1] Aqui entra em cena o conceito de reciprocidade, ou como dizem alguns autores, "voc coa minhas costas, depois eu coo a sua". Eu colaboro com voc, ento voc colabora comigo. Mas sabendo que as pessoas respondem a incentivos, e que a recompensa por uma traio maior, o que garante que eu no vou trair? Como Axelrod coloca, nas situaes em que cada indivduo tem um incentivo para ser egosta, como a cooperao pode se desenvolver? A resposta para este dilema, segundo os cientistas em Teoria dos Jogos, est na repetio infinita das interaes entre os jogadores. O que torna possvel a cooperao o fato dos jogadores poderem se encontrarem vrias vezes. Traduzindo: vou colaborar porque sofrerei retaliao se eu trair, e melhor voc colaborar comigo pois vou retali-lo se voc me trair. A traio mtua no vantajosa para ningum. O conceito simples e intuitivo, mas foi sistematizado e provado. O estudo mais conhecido sobre interaes repetitivas do jogo do Dilema dos Prisioneiros foi um concurso de computador conduzido por Axelrod em 1980. Ele convidou vrias pessoas renomadas em Teoria dos Jogos, Psicologia, Sociologia, Cincias Polticas e Economia para submeter estratgias interativas para um concurso via por computador. O computador era apenas para ter velocidade na simulao (o concurso poderia ser feito com vrias pessoas presentes, lpis e papel). Como definio, uma estratgia uma sequncia de regras de deciso, uma especificao do que fazer em qualquer situao que possa surgir. Uma estratgia pode ser cooperar durante alguns padres e trair em outros, ela pode usar probabilidades, pode usar o padro do concorrente e de resultados para decidir o que fazer em seguida. Neste concurso, a estratgia deveria especificar o que fazer a cada interao do Dilema dos Prisioneiros e poderia usar todo histrico de

interao (sua e do oponente). Para cada jogada, o resultado era em pontos, como na matriz abaixo.

Jogador B Colaborar Trair Jogador A Colaborar Trair 3,3 5,0 0,5 1,1

Relembrando, esse esquema de pontuo relembra o esquema do Dilema dos Prisioneiros. Duas pessoas esto em um jogo. Eles precisam escolher entre duas opes: Cooperar ou Trair. As possveis combinaes so: 1. Se ambos cooperarem, cada um ganha 3 pontos como Recompensa. 2. Se ambos trairem, cada um ganha 1 ponto, que a Punio por falharem em juntar foras. 3. Se um trair enquanto o outro coopera, o traidor recebe 5 pontos (que a Tentao) e o colaborador no recebe nada ( o Idiota). Como um jogodor racional ir jogar? Traindo, claro. Esta a resposta correta, no importando o que ou outro vai fazer, porque: - Se o outro jogador vai Cooperar, ento voc ganha 5 pontos ao Trair ou 3 pontos ao Cooperar. Melhor trair. - Se o outro jogador vai Trair, ento voc ganha 1 ponto ao Trair ou 0 pontos ao Cooperar. Melhor trair. O problema que o outro jogador, sendo racional tambm, pensa exatamente da mesma forma. Como resultado, ambos acabam ganhando apenas 1 ponto, muito menos se existisse uma cooperao mtua, pois poderiam ganhar 3 pontos. Como Karl Sigmund coloca, o Dilema do Prisioneiro no , de fato, um dilema, pois trair a nica opo racional [Nota 2]. Ento, como conseguir a cooperao? A resposta est na repetio do jogo, como foi demonstrado no concurso. Neste torneio, cada programa competia com todos os outros programas (inclusive com ele mesmo) e os pontos eram acumulativos. Cada jogo consistia em 200 jogadas. Como possvel ganhar 5 pontos em cada jogada, teoricamente a pontuao final varia de 0 a 1.000. Por exemplo: quando uma estratgia "Sempre Cooperar" joga contra uma estratgia "Sempre Trair", quem cooperar soma 0 pontos e quem trai soma 1.000 pontos. Uma pontuao razovel ganhar 3 em todas as 200 interaes quando ambos cooperam toda vez, somando 600 pontos. Importante mencionar que no h uma estratgia certa pois depende contra qual adversrio voc est jogando. Nenhuma estratgia melhor independente da estratgia do outro. Por exemplo, se jogar contra um programa que sempre colabora, a sua melhor estratgia trair sempre pois consegue 5 pontos a todo momento. O problema que nem sempre voc sabe contra quem est jogando; no porque seu oponente cooperou 2 vezes que ele ir cooperar as 200 jogadas. O inverso tambm verdade; se voc encontrar um jogador que sempre trai, ento melhor trair pois ao menos voc consegue 1 ponto no lugar de zero. Jogar contra um jogador que sempre colabora ou sempre trai muito simples. Mas na prtica o seu oponente reage conforme a sua jogada e conforme as crenas que ele tem sobre voc. Alm disso, o concurso no esperava encontrar a estratgia mais bondosa, mais tica. O que ele esperava era descobrir qual a estratgia que somaria pontos, considerando que os jogadores no podiam se comunicar e que levavam em conta, a cada momento, as decises do passado como aprendizado. Neste primeiro concurso, quatorze estratgias foram inscritas. Axelrod acrescentou mais um jogador com uma estratgia "Aleatria" (50% entre cooperar e trair). A estratgia inscrita mais longa teve 77 linhas de cdigo de programa, e esta foi obteve a pior resultado de 282,2 pontos em mdia. A estratgia aleatria foi um pouco pior, com 276,3 pontos. OLHO POR OLHO

A estratgia com maior pontuao foi tambm a estratgia mais simples. Enviada por Anatol Rapopor, foi chamada de OLHO POR OLHO (em ingls, TIT FOR TAT). Ela tinha 4 linhas de cdigo e pode ser explica numa sentena: coopere na primeira jogada, depois faa o que o outro jogador fez na jogada passada. OLHO POR OLHO fez em mdia 504,5 pontos. Contra estratgias especficas a pontuao variou do menor score de 225 pontos at o mximo de 600 pontos. William Poundstone explica bem o sucesso desta estratgia. [NOTA 4]
[NOTA 3]

Por que a estratgia OLHO POR OLHO to efetiva? Primeiro, ela uma estratgia gentil pois nunca a primeira a trair. Ela comea colaborando e d ao oponente o benefcio da dvida. Se a outra estratgia retornar o favor e continuar assim, OLHO POR OLHO nunca trai. Ela no arranja encrenca e fica contente se assim continuar. Quando OLHO POR OLHO joga contra si mesmo, ambos comeam cooperando e nunca provocam o outro. Para se ter noo, os oito primeiros classificados tinham uma estratgia gentil, ou seja, nunca ser o primeiro a trair. Os outros no eram. As estratgias gentis pontuaram entre 472 e 504 pontos. A estratgia no-gentil melhor classificada obteve 401 pontos. Assim, no ser o primeiro a trair era uma propriedade que separava as estratgias mais bem-sucedidas das menos bem-sucedidas. Segundo, OLHO POR OLHO tambm provocativa. Ela trai em resposta a uma traio. Depois da segunda rodada, ela responde a provocao do outro na mesma moeda. Se a outra estratgia trai na jogada 5, ento OLHO POR OLHO trai na rodada 6. Terceiro, outro grande predicado de OLHO POR OLHO o perdo. Ela no draconiana a ponto de uma simples transgresso levar a traio perptua. Ela sempre est disposto a cooperar a medida que o oponente queira cooperar. Se a outra estratgia cooperar, ento OLHO POR OLHO volta a cooperar para sempre. Quarto, alm de ser gentil, provocativa e disposta ao perdo, OLHO POR OLHO uma estratgia simples. Ela ameaa "faa ao outro o que eles fizerem com voc". A ameaa faz parte do seu comportamento estratgico, e OLHO POR OLHO cumpre a promessa ao repetir a ao mais recente do oponente na esperana que a outra estratgia perceba isso. Interessante que OLHO POR OLHO pune a traio do adversrio de imediato, na prxima jogada. Essa estratgia melhor que outras, do tipo "contar at 10 antes de ficar zangado" (ou seja, deixar um certo nmero de traies antes de retaliar). Quinto, outra qualidade importante do OLHO POR OLHO que sua estratgia no segredo. Algum jogando OLHO POR OLHO no precisa ter medo que o oponente descubra sua estratgia. Pelo contrrio, bom que o oponente saiba disso. Quando se joga contra OLHO POR OLHO, ningum pode se sair melhor do que cooperar. Isso faz dela uma estratgia muito estvel. O primeiro concurso de Axelrod no foi to conclusivo porque a pontuao de uma estratgia depende da combinao com outras estratgias. Como foram inscritos apenas 14 programas, seria provvel que no representassem todas as estratgias possveis no mundo. Por isso Axelrod promoveu um segundo concurso e informou o resultado do primeiro e do sucesso do OLHO POR OLHO. Estava implcito que agora o desafio era vencer OLHO POR OLHO. No total, foram inscritos 62 programas de 6 pases. Apesar da forte concorrncia, OLHO POR OLHO venceu novamente. O mais interessante que OLHO POR OLHO ganhou sem explorar nenhuma outra estratgia. Ainda, OLHO POR OLHO no venceu ningum em particular, mas mesmo assim ganhou o concurso. As estratgias foram chamadas para competir, e no colaborar. Ou seja, o objetivo era somar mais pontos, mesmo se precisasse trair. No havia julgamento moral, trair fazia parte legtima do jogo. E o intrigante que a estratgia vencedora, o OLHO POR OLHO, prega a colaborao; quem mais colaborou ganhou mais pontos somando todos os jogos. O prprio Axelrod no seu livro conclui: "OLHO POR OLHO venceu o torneio porque ele foi bom nas suas interaes com

uma grande variedade de outras estratgias. Em mdia, foi melhor do que qualquer outra regra contra as outras estratgias no torneio. No entanto, OLHO POR OLHO no pontuou melhor em nenhum jogo comparado com seu o adversrio! Na verdade, ele no pode. Ele deixa o outro jogador trair primeiro, depois nunca escolhe trair mais vezes que os outros jogadores traiam. Portanto, OLHO POR OLHO atinge sempre a mesma pontuao que o outro jogador, ou pouco menos. OLHO POR OLHO venceu o concurso no por ganhar dos outros jogadores, mas sim forando o comportamento do outro jogador e deixando-o fazer o bem. OLHO POR OLHO foi to consistente em proporcionar resultados mutuamente gratificantes que alcanou maior pontuao geral do que qualquer outra estratgia". Uso da OLHO POR OLHO na vida real Em resumo, a estratgia OLHO POR OLHO educa o oponente para a cooperao. Na vida real, se voc trair, na prxima rodada seu oponente ir te trair e criar uma situao indesejvel. Por isso, voc tem incentivos para colaborar e dar o exemplo para que nas prximas interaes vocs consigam uma situao de ganha-ganha. Mas se voc cooperar para dar o exemplo e ele trair para se aproveitar da situao? Da voc retribui com uma retaliao na sequncia. Se ele colaborar, voc perdoa e volta a colaborar. Mas ser que a simples repetio da interaes e convivncia leva a cooperao? Karl Sigmund defende que se o nmero de interaes conhecido com antecedncia por ambos jogadores, no haver cooperao. A ltima rodada da srie o simples Dilema do Prisoneiro de uma jogada s e o resultado j conhecido: a traio, pois no haver prxima oportunidade para sofrer a retaliao. Nesta ltima interao, trair no traz consequncia de retaliao e no afetar as prximas rodadas (que no existiro). Uma vez que passado passado, nem a gratido nem a vingana tero efeito e assim no h motivos para desviar a estratgia de maximizar o ganho ao trair. Uma vez a ltima interao j est definida (trair), o que acontecer na penltima jogada? A mesma coisa (trair), pois no h incentivo para colaborar se voc sabe que o adversrio vai trair pelo mesmo raciocnio - a penltima jogada tem as mesmas caractersticas da ltima jogada. Retroagindo o raciocnio para todas as jogadas, descobre-se que no haver colaborao em nenhum ponto se ambos pensarem racionalmente. E se voc no pensar assim, e seu adversrio sim, ele usar sempre a traio e, sabendo disso, colaborar dar ganhos bem menores. E a? Nunca existir cooperao? Em um jogo repetido, a expectativa de futuros encontros que faz a cooperao ser mais atraente. O fim das interaes no deve ser conhecido com antecedncia, deve sempre existir alguma probabilidade de uma prxima jogada. Este o significado da expresso "O mundo d voltas" e o poder educativo de deixar claro a sua estratgia OLHO POR OLHO: "Voc coa as minhas costas e eu coo as suas, mas se voc trair, saiba que o mundo d voltas, voltaremos a nos encontrar e revidarei com traio. Ento melhor para todos colaborar desde j, como eu estou fazendo desde o incio - sempre colaboro, eu perdoo, mas no sou idiota".
[NOTA 1] A Evoluo da Cooperao, de Robert Axelrod, 2010, Leopardo Editora (original em ingls de 1984) [NOTA 2] Games of Life, Karl Sigmund, 1993, Penguin Books [NOTA 3] Se voc quer fazer simulaes de computador para ver por si mesmo, a IOWA State University possui um timo software com essas estratgias. O link http://www.econ.iastate.edu/tesfatsi/demos/axelrod/axelrodT.htm. Com o software voc pode escolher quais estratgias jogaro entre si, quais os resultados, quantas rodadas e verificar os vencedores em formato de tabela e grfico. [NOTA 4] Livro Prisoners Dilemma, de William Poudstone, 1992, Anchor Books

No h razo para dar gorjeta em restaurante

[OBS: para melhor aproveitar este artigo, sugiro primeiro ler o O que o Dilema dos Prisioneiros como introduo e demais na sequncia] Voc leu nos artigos anteriores que a cooperao no mundo da Teoria dos Jogos ocorre quando h interaes repetidas e particularmente no se sabe quando ser a ltima vez. Numa situao estilo Dilema dos Prisioneiros de apenas uma jogada, a melhor estratgia racional trair, uma vez que no h uma nova chance para o outro revidar. Escrevi a palavra "razo" no ttulo no sentido de racional, mas evidentemente h outros "motivos" para cooperar. Vamos usar o exemplo de um restaurante onde a gorjeta opcional. No se trata de um Dilema dos Prisioneiros tpico onde "o melhor racional individual o pior coletivo", mas a analogia com situaes repetidas versus interao nica se encaixa bem neste Dilema da Gorgeta. H tempos que os economistas se perguntam: porque as pessoas do gorjetas?. Existem duas explicaes - uma emocional e uma racional. A emocional refere-se ao sentimento de que o garon recebe salrio fixo muito baixo e depende de gorjetas para complementar a renda, e assim h uma atitude altrusta de agradecimento e colaborao. A explicao racional desta "generosidade" est exatamente no auto-interesse do cliente nas interaes repetidas - frequentadores assduos do gorjetas mais polpudas justamente porque os garons, na prxima vez, iro atender cada vez melhor. Se dar gorjeta para receber um melhor servio na prxima vez um raciocnio vlido, imagine o inverso. Se voc no der gorjeta, alguns garons ficam chateados e outros ficam revoltados e vingativos. preciso tomar cuidado com algumas reaes. Por isso, suponha que voc um frequentador assduo de um restaurante e nunca d gorjeta. Provavelmente o garon lembrar de voc na prxima vez. Essa uma situao de interao repetida com demonstrao de traio, ento cuidado com os garons vingativos e seu amigo cozinheiro... Entretanto, voc est viajando, sabe que nunca vai voltar naquele restaurante, ento por qual razo daria gorjeta? Ainda, porque dar mais dinheiro ao taxista ou camareira? Do ponto de vista racional econmico no mundo do auto-interesse, no h razo para cooperar (gastar mais), especialmente se o valor alto. A prtica da gorjeta contraria os pressupostos da economia clssica, afinal a gorjeta uma despesa que os consumidores so livres para evitar e o pagamento realizado aps o servio feito sem vnculo para melhorar a qualidade. Mesmo assim percebe-se que as pessoas deixam gorjetas, mesmo quando nunca mais retornaro, ou so fregueses raros cuja probabilidade de reencontrar o mesmo trabalhador novamente mnima. Acadmicos recorrem para as normas sociais, e no econmicas, como a nica explicao para este fenmeno, uma vez que j virou uma prtica quase universal nos estabelecimentos.

Uso do Dilema dos Prisioneiros num Reality Show


O Dilema dos Prisioneiros uma excelente analogia sobre como as pessoas se comportam quando precisam decidir se cooperaram ou no. Eu chamaria de Dilema da Confiana. Se voc no conhece isso, leia primeiro O que o Dilema dos Prisioneiros e tambm Cooperao ocorre nos Jogos Repetitivos. O vdeo abaixo encontrado no YouTube e num post do Freakonomics. Eu editei o vdeo para ficar mais curto e objetivo, e

no final eu fao a minha prpria anlise.

Programa "Bachelor Pad" - Keep Or Share? (Mantm ou Compartilha?)


O episdio final do reality show Bachelor Pad (Rede americana ABC, 06/09/2010) apresentou um desafio interessante. Quando chegou a hora de prmio final, de US$ 250.000, os dois finalistas, Dave e Natalie, foram forados a entrar em salas separadas e decidir se eles queriam "manter" ou "compartilhar" o prmio final. - Se ambos escolhessem "compartilhar", o dinheiro seria dividido igualmente entre eles (US$ 125.000 cada). - Se apenas um escolhesse "compartilhar" e o outro "manter", quem escolhesse "manter" receberia o prmio inteiro (US$ 250.000) e o outro no ganharia nada. - Se ambos escolhessem "manter", nenhum deles receberia o dinheiro, que deveria distribuido para a platia. Segundo a Teoria dos Jogos e a forma em que os incentivos (as recompensas) deste jogo colocado aos jogadores, a deciso racional Manter, ou seja, trair e ficar com todo dinheiro.

Foi isso que aconteceu? Assista o vdeo abaixo antes de continuar a leitura.

Acabamos de assistir que ambos preferiram compartilhar. Por que isso aconteceu? Seguem algumas hipteses:

1. Como primeira resposta, poderamos dizer que os jogadores no seguiram a soluo racional, ento eles simplismente
foram irracionais. Mas no uma boa explicao, afinal ganharam $ 125 mil e se ambos trassem ganhariam nada.

2. Outra possvel explicao seria que as regras foram ditas quando ambos os competidores estavam sentados juntos.
Assim, imediatamente os dois fizeram contato com os olhos e combinaram em compartilhar dado o relacionamento anterior. Isso bem diferente dos prisioneiros que estavam em sala privada de interrogatrio e no podiam se comunicar. Entretanto, embora eles possam ter combinado com os olhos, nada impediria de trair no final e ganhar tudo. Como voc poderia confiar? Bastaria o compromisso e a tica? No necessariamente.

3. Poderamos tambm argumentar que, na verdade, este no um Dilema dos Prisioneiros tpico devido a forma que o
prmio (os incentivos, payoffs) so arranjados para cada alternativa - vide a figura abaixo.

De acordo com o Dilema do Prisioneiro tpico, a estratgia de traio tecnicamente "estritamente domina" a estratgia de cooperao, ou seja, no importa o que o outro jogador decida fazer, voc sempre maximiza o seu resultado ao trair. No entanto, neste caso, se um Dave decide manter o dinheiro (trair a Natalie), ento Natalie indiferente entre compartilhar e manter, j que ela no recebe qualquer dinheiro de qualquer maneira (resultado zero). Uma vez que ela recebe nada de qualquer forma, quem sabe ela pode preferir Compartilhar, deixando o Dave ficar com o dinheiro do que distribuir para a platia. Resumindo, se Dave escolher Compartilhar, a melhor escolha de Natalie seria Manter (ficar com todo dinheiro). Mas se Dave escolher Manter, Natalie no tem uma melhor escolha (ambas opes zero, por isso dizemos que ela indiferente). Portanto no existe uma estratgia dominante, e o inverso tambm verdade para Dave. Nesta configurao no existe Equilbrio de Nash para Manter-Manter (Trair-Trair). Consequentemente, a deciso racional no trair, o que torna a deciso mais difcil. O resultado do jogo no racional nem previsvel.

4. Outra explicao. Esta matriz de deciso (a forma em que os incentivos so distribudos) bastante equilibrada em
termos do dinheiro, o que a torna muito menos interessante. Imagine se trair recebesse US$ 250 mil, se amboms compartilharem recebessem apenas US$ 30 mil cada, e se ambos trairem ele ganhasse 8 mil, como na figura abaixo. Com certeza a tentao para trair seria MUITO maior....

Este sim seria o desenho de um Dilema dos Prisioneiros tpico. Nitidamente a opo Manter (trair) a estratgia dominante pois melhor Manter e ganhar 8 mil do que nada.

5. Mas a explicao que eu acho mais razovel que este jogo no termina aqui. Vimos pela Teoria dos Jogos que a
repetio do jogo leva a cooperao devido o medo de retaliao nos prximos passos. Neste caso, o fator amizade ou companherismo desenvolvido ao longo do programa induz a uma deciso emocional - no correto trair um colega. Mas ainda um resposta parcial. Um reality show mostra por muito tempo a vida e perfil dos jogadores e todos acabam por construir alguma reputao no perodo. Essa reputao servir para conquistas futuras, como namorados, empregos, patrocnio, exposio na mdia, etc. Dado a alta exposio e envolvimento dos participantes com o pblico, a deciso politicamente correta compartilhar. Se o jogador trair, ele no sabe qual o impacto causaria na sua reputao, carreira ou relacionamento; assim mais seguro compartilhar. O jogo da vida no termina ai. Os benefcios futuros bem maior do que a "perda" pontual em compartilhar, mesmo sendo US$ 125 mil. Ou seja, continua vlida a Teoria dos Jogos (mesmo no existindo a estratgia dominante como num dilema dos prisioneiros tpico), onde a repetio do jogo e o medo da retaliao leva a cooperao. Essa cooperao continua sendo "egosta". Em outras palavras, visando seu prprio interesse, melhor cooperar.

Programa "Golden Balls" - Split Or Steal? (Divide ou Rouba?)


Agora veja o vdeo abaixo, encontrado no Youtube. O programa Golden Balls (rede inglesa ITV, 14/03/08) tambm oferece no final a chance de "Dividir" ou "Roubar". As regras do jogo so iguais ao anterior.

Como vimos, eles combinaram explicitamente em dividir, mas a moa desrespeita o acordo e trai. E agora, o que dizer deste comportamento de acordo com a Teoria ? De novo, a configurao do jogo no tem uma estratgia dominante para que traio seja a soluo racional ( o que faz o jogo ser um "dilema"). Entretanto, existe um componente clssico neste jogo que mais prximo ao tpico Dilema dos Prisioneiros: os dois jogadores nunca se viram, nunca se relacionaro depois (realmente o fim do jogo), a moa no figura pblica, no precisa da reputao e usou da boa f do outro jogador que se prometeu dividir. Neste Dilema da Confiana, a moa no foi confivel. E ganhou. No exatamente um boa moral da estria nem um conselho para trair. simplemente uma constatao do comportamento humano de acordo com incentivos matemticos e a lgica. Sem repetio do jogo, as pessoas tem incentivos para trair. por isso que turistas, em lugares que nunca mais voltaro, no tem incentivos para dar grandes gorgetas, diferente de voc que sempre frequenta o mesmo restaurante. Nunca se sabe a reao de um garon ou cozinheiro... Afinal, o mundo d voltas.

Free-riders e Tragdia dos Comuns


Alm do Dilema dos Prisioneiros, outra poderosa estria-modelo com caractersticas similares a Tragdia dos Comuns. Len Fisher, no livro Rock, Paper, Scissors - Game Thoery in Everyday Life explica a origem deste nome. O termo Tragedy of the Commons (commons no sentido de "pblico") foi cunhado pelo ecologista e terico dos jogos Garrett Hardin numa publicao em 1968. Hardin ilustra o problema usando a parbola de um grupo de pastores que tinham seus animais numa terra pblica. Cada pastor pensava em adicionar um animal ao seu rebanho com o seguinte raciocnio: um animal extra proporcionaria um bom lucro adicional, e no geral a pastagem diminuiria somente um pouquinho, ento parece perfeitamente lgico ao pastores colocarem um animal extra. A tragdia ocorre quando todos os outros pensam na mesma maneira. Quando todos adicionam um animal, a terra se torna superpopulada e em breve no h nenhum pasto mais sobrando [1]. Como Fisher brinca, a Teoria dos Jogos explica porque colherinhas gradualmente desaparecem das reas comuns de escritrios. Tecnicamente falando, os usurios de colheres tomam decises considerando que a utilidade deles (ou seja, os seus prprios benefcios) cresce bastante ao pegar uma colher para uso pessoal enquando a utilidade de todos os demais colegas diminui uma pequeninha frao per capita (afinal, h uma monte de colheres). Mas a medida que todos tomam a mesma deciso, todas as colheres comuns desaparecem! Basta fazer a analogia das colheres para qualquer outro recurso e ver que srios problemas globais tem como origem o mesmo ciclo vicioso desta lgica de pensamento. O benefcio individual causa grande custo para a comunidade envolvida. A tragdia dos comuns exerce seu poder destrutivo quando alguns colaboraram por benefcio mtuo mas outros percebem que poderiam se sair melhor ao quebrar a cooperao. Se eu jogar papel no cho, meu pedacinho no far sujeira alguma, mas se todos jogaram, as ruas ficam atoladas de lixo. Essa a essncia do free rider (em portugus poderiamos dizer de caronista). O free rider se beneficia ao no colaborar, sempre est pegando carona nas costas dos outros que colaboram. Em um modelo de condomnio, onde a gua do prdio

dividida de forma igual a todos os apartamentos, se eu gastar um pouco mais no pagarei pelo meu consumo pois ser rateada por todos os 40 condminos. por isso que a tendncia dos edifcios mais modernos possuir medidor individual para cobrar o consumo exato de cada unidade. Mais exemplos: dividindo a conta de um restaurante Um caso tpico de diviso de recursos comuns ocorre no pagamento de uma conta de restaurante. Em um sistema a la carte, onde cada convidado escolhe seu prato, um mtodo tradicional de diviso repartir a conta em partes iguais, independente da quantidade consumida. Sabemos cada prato tem um preo diferente - h pratos caros e baratos. Alm disso, alguns pedem entrada e outros no, alguns comem somente salada, h os que pedem sobremesa. Bebedores pedem vinho e outros apenas suco. E assim vai - na hora de dividir algum vai pagar mais ou menos se comparado com o valor exato ingerido. Os defensores argumentam que separar os valores individuais d muito trabalho (anotaes em papel, calculadora, gorgeta proporcional), alm de ser indelicado e, afinal, um produto compensa o outro. Mas o problema no reside no mtodo de diviso em si. A analogia com a Tragdia dos Comuns a seguinte. Cada convidado pode pensar da seguinte maneira - eu vejo que todo mundo est pensando em pedir a carne por $20 cada, mas h o camaro por $40. Como somos em 10 pessoas, se eu pedir camaro, pagarei uma frao adicional pequena pois os meus $40 sero diludos em dez. Ainda, se eu ficar na carne e outros pedirem um prato mais caro, eu que estarei pagado a mais sem usufruir. Entretanto, todos tem o mesmo racional e quando se percebe todos pediram camaro para pegar carona e o desastre grande - a conta fica muito mais cara do que gostariam (ou do que seria se estivessem sozinhos ou se o sistema fosse outro). Sabendo deste comportamento humano, se voc fosse um dono de restaurante, qual modelo de cobrana adotaria - uma conta nica por mesa ou sistema de comandas individuais? Mas um dos fenmenos mais nocivos onde vemos o problema do Dilema dos Prisioneiros, Tragdia dos Comuns e Free rider a discusso sobre aquecimento global, onde os jogadores so os governos dos pases. Este um exemplo tpico onde o auto-interesse individual causa problemas para todos os habitantes. Investir contra o aquecimento global muito caro para os pases, so necessrias mudanas de polticas de emisso de gases, sistemas de controles, despesas em mtodos alternativos de energia, etc. Se eu gastar uma fortuna e os outros pases no, minhas aes isoladas no faro a menor diferena na natureza. Por outro lado, se os outros pases o fizerem e eu no, vou me beneficiar de um melhor clima mundial as custas dos demais sem gastar um centavo. O prximo artigo discorre isso melhor (Jogando com o Planeta - Teoria dos Jogos e Aquecimento Global). Insights para resolver o dilema Poderamos evitar situaes da Tragdia dos Comuns se todos mudassem de comportamento e tornassem mais altrustas. Mas a vida assim, alguns comportamentos humanos so frutos dos incentivos existentes. A Teoria dos Jogos no faz julgamento moral, ela simplesmente aceita o fato que o auto-interesse uma motivao das pessoas na hora de fazer decises. O papel da Teoria ajudar, atravs de modelos e analogias, as pessoas a reconhecerem esta armadilha e ter alguns insights para sair dela. Uma sada j mencionada usar a gesto de uma autoridade central (ver artigo Colaborao via Autoridade Central: exemplo da Lei Cidade Limpa) para punir seriamente aqueles que desviam do combinado, mudando os incentivos do jogo. Outra forma adotando a estratgia Olho por Olho (ver artigo Cooperao via estratgia OLHO por OLHO) ao punir o adversrio quando este o trair, mantendo sempre a colaborao como guia mestre de conduta. Entretanto, esta ltima estratgia funcional apenas quando voc est interagindo com um jogador de cada vez, o que no o caso quando se joga contra mltiplas pessoas, como na Tragdia dos Comuns e outros Dilemas Sociais. Nestes casos necessrio um

formato de medio individual. Como vimos, uma medio individual ter um aparelho de consumo de gua por apartamento ou ter uma comanda de consumo particular no restaurante. Em outros casos, ter cmeras de vigilncia em todos os lugares para apontar os infratores de jogar papel no cho e roubarem colheres do escritrio. No fcil, conhecemos muitos free riders no escritrio ou na faculdade que se beneficiam do trabalho coletivo e no fazem muita contribuio relevante (sim, d raiva). Aqui a palavra chave accountability, do ingls que poderamos chamar de responsabilizao, ao conseguir diferenciar e medir os esforos e aes individuais. Caso contrrio, a Tragdia dos Comuns ser o reino dos Free Riders.
[1] Rock, Paper, Scissors - Game Thoery in Everyday Life, Len Fisher, 2008, Basic Books

Aquecimento Global e Teoria dos Jogos


Uma verso do dilema do prisioneiro pode sugerir formas de romper o impasse de Quioto
Baseado no artigo "Playing games with the planet", The Economits, 27/09/2007 - original nos Links

Como em qualquer encontro sobre alteraes climticas, sempre existem polticos que declaram que "urgente" ou "vital" ou "imperativo" proteger o planeta do superaquecimento. E mesmo assim poucos governos estam dispostos a resolver o problema por si mesmos. Na prtica, o que esses apaixonados oradores geralmente querem dizer que urgente (vital, imperativo) para todos os outros pases, exceto para seus prprios. Isso natural. Afinal, todos os pases desfrutaro dos benefcios de um clima estvel se eles ajudaram a realiz-lo ou no. Ento, um governo que possa persuadir os outros a cortar suas emisses de gases de efeito estufa sem faz-lo obtm o melhor dos dois mundos: evita toda a despesas envolvidas e ainda escapa da catstrofe. Os mais bvios "free-riders" so os Estados Unidos e Austrlia, os nicos pases ricos que se recusam a colocar um limite para suas emisses. Mas eles esto longe de serem os nicos agressores: a maioria dos pases pobres tambm esto interessados em responsabilizar os pases ricos em conter o aquecimento global para continuar a poluir.

Onde entra a Teoria dos Jogos


O problema, claro, que se todos contarem que os outros vo agir, entoningum vai atuar e as conseqncias podem ser muito piores do que se todos fizessem a sua parte s um pouquinho para comear. Os especialistas em Teoria dos Jogos chamam esse cenrio de uma verso simplificada do "Dilema do Prisioneiro". Nele, dois presos acusados do mesmo crime se encontram em celas separadas, incapazes de se comunicar. Seus carcereiros tentam convenc-los a delatar um ao outro. Se nenhum deles acusar ao outro, ambos recebero uma sentena de apenas um ano. Se um aceitar o acordo e o outro ficar calado, o traidor fica livre enquanto o bode expiatrio pega dez anos de cadeia. E se ambos denunciarem um ao outro, ambos ficam presos cinco anos. Se o primeiro prisioneiro est planejando ficar quieto, o segundo tem um incentivo para denunci-lo, e assim sai impune ao invs de passar um ano na priso. Se o primeiro prisioneiro est planejando trair o segundo, ento o segundo vai levar a melhor se trair tambm, e assim receber uma sentena de cinco anos em vez de dez anos. Em outras palavras, uma pessoa racional, com auto-interesse, sempre vai trair o seu companheiro de priso. Assim, os dois ficam cinco anos na cadeia

enquanto poderiam ter cortado sua pena para um ano caso ambos ficassem calado. Almas pessimistas assumem que a resposta internacional mudana climtica ter o mesmo rumo que o dilema do prisioneiro. Lderes racionais vo sempre negligenciar o problema, alegando que os outros vo resolv-lo, deixando seu pas se tornar um free-rider. Assim, o mundo est condenado a ser um forno, apesar do aquecimento global poder ser evitado se todos cooperassem. No entanto, em um artigo recente, Michael Liebreich, da empresa de pesquisa New Energy Finance, baseia-se na Teoria dos Jogos para chegar concluso contrria. A dinmica do dilema do prisioneiro, ele aponta, muda drasticamente quando os participantes sabem que jogaro o jogo mais de uma vez. Nesse caso, eles tm um incentivo para cooperar a fim de evitar ser punido por sua m conduta de seu oponente em rodadas subseqentes. O jornal cita um estudo sobre o assunto por um acadmico americano, Robert Axelrod, que argumenta que a estratgia mais bem sucedida quando o jogo repetido tem trs elementos: primeiro, os jogadores devem comear cooperando; em segundo lugar, eles devem deter a traio ao punir o transgressor na prxima rodada; e terceiro, eles no devem guardar rancores, mas sim iniciar novamente com cooperao aps a punio adequada. O resultado desta estratgia deve ser a cooperao sustentvel ao invs de um ciclo de retaliaes. Liebreich acredita que tudo isso traz lies para os negociadores do clima mundial. Tratados sobre a mudana climtica, afinal, no jogos de uma jogada s. Na verdade, as Naes Unidas est agora mesmo incentivando seus membros para negociar um sucessor para o seu tratado em vigor, o Protocolo de Kyoto, que expira em 2012. Muitos temem que o esforo entrar em colapso a menos que os retardatrios sejam persuadidos a aderir. Mas o artigo argumenta que os pases racionais no sero intimidados por "free-riders". Eles continuaro a reduzir suas emisses, enquanto elaboram sanes para aqueles que no o fazem.

Resolvendo Quioto
O Protocolo de Quioto j incorpora alguns desses elementos. Os pases que no cumprirem os seus compromissos, por exemplo, deveriam ser punidos com a obrigao de reduzir suas emisses de forma mais acentuada na prxima vez. Mas Liebreich argumenta que tambm deve haver sanes para os pases ricos que se recusam a participar, e incentivos para os pases pobres para juntar-se (que so isentas de quaisquer cortes obrigatrios). Ao invs de tentar elaborar um acordo que agradvel a todos, os pases mais entusiasmados devem simplesmente avanar com um sistema para que os resistentes possam aderir mais tarde. O regime global sobre mudana climtica, Liebreich acredita, tambm dever se revisto com mais freqncia para permitir que o jogo se desenvolva mais rapidamente. Ento, ao invs de estipular grandes redues de emisses, a ser implementado ao longo de cinco anos, em Quioto, os negociadores poderiam considerar a adoo de metas anuais. Dessa forma, os governos cooperativos sabem que no podem ser aproveitados por muito tempo, enquanto que free-riders podem ser punidos e de volta ao rebanho mais rapidamente. H falhas na analogia, claro. No mundo real, os governos podem se comunicar e formar alianas, o que torna a dinmica do jogo muito mais complicado. E os governos podem no agir de forma coerente e racional. Algumas pessoas assumem que a poltica dos EUA sobre o aquecimento global vai mudar em 2008 (o texto foi escrito em 2007), juntamente com o seu presidente. E a vontade da maioria dos pases em agir presumivelmente ligada gravidade dos efeitos do aquecimento global. Se as coisas ficam ruins o suficiente, ento com alguma sorte todo mundo vai jogar o jogo.
Baseado no artigo "Playing games with the planet", The Economits, 27/09/2007 - original nos Links

Rinocerontes e Free-riders
Os rinocerontes pretos so uma das espcies mais ameaadas em extino no planeta. Menos de 2.500 vivem no sul da frica - dos 65.000 existentes em 1970. Esse um desastre ecolgico, mas tambm uma situao onde conceitos bsicos de economia explicam porque certas espcies esto em perigo e o que podemos fazer a respeito. Por que as pessoas matam os rinocerontes pretos? Pela mesma razo que as pessoas vendem drogas ou trapaceiam nos impostos - elas podem ganhar muito dinheiro em relao ao risco de serem pegas. Nos pases asiticos, o chifre do rinoceronte preto considerado um afrodizaco poderoso e um remdio para abaixar a febre. Como resultado, um nico chifre de rinoceronte atinge US$ 30.000 no mercado negro, um valor enorme para pases onde a renda per capita aproximadamente US$ 1.000 por ano. Em outras palavras, o rinoceronte preto bem mais valioso morto do que vivo para a populao pobre no sul da frica. Infelizmente, este um tipo de mercado que no se regula por si prprio. Diferente de automveis ou computadores, as empresas no produzem novos rinocerontes pretos as medida que a fonte de suprimento diminiu. Na verdade, ocorre o oposto, a medida que o rinoceronte preto fica mais raro, o preo do chifre no mercado cresce ainda mais, dando mais incentivo ainda para os bandidos caarem os rinocerontes restantes. O crculo vicioso composto por outro aspecto comum em muitos desafios ambientais. A maioria dos rinocerontes pretos so de propriedade pblica, no ficam em propriedades privadas. Isso cria mais problemas de conservao. Imagine se todos os rinocerontes estivessem na mo de um fazendeiro avarento que no tivesse nenhum escpulo em matar rinocerontes para transform-los em p afrodizaco. Esse fazendeiro no tem nenhuma paixo pelo meio ambiente. Ele to maldoso e egosta que as vezes chuta no cachorro apenas por prazer. Voc acha que esse fazendeiro inescrupoloso teria deixado o seu rebanho de rinocerontes cair de 65.000 para 2.500? maximizar o valor dos recursos escassos. Recursos comuns, por outro lado, apresentam seus problemas. Primeiro, a populao dos vilarejos que moram perto dos rinocerontes no possuem benefcio algum em t-los por perto. Ao contrrio, animais enormes como rinocerontes e elefantes podem causar distruio massiva nas plantaes. Ao se colocar na posio destes moradores, imagine que a populao da frica de repente ficou muito preocupada em preservar ratos marrons e que a forma de proteger deix-los viver na sua casa. Da imagine que um fazendeiro te oferece muito dinheiro se voc mostrar onde eles esto no seu poro. Humm. verdade que milhes de pessoas se beneficiam em conservar rinocerontes pretos e gorilas das montanhas, mas isso pode ser parte do problema - fcil ser um free-rider e deixar outras pessoas (ou organizao) fazer o servio. No ltimo ano, quanto tempo e dinheiro voc contribuiu para preservar espcies ameaadas em extino? Operadores de safari, que ganham dinheiro ao trazer turistas ricos para ver a vida selvagem, encontram problema similar de free-rider. Se uma das empresas de safari investe bastante na conservao, a outra empresa que no fez investimentos ainda se beneficia pelos rinocerontes que foram salvos. Ento a operadora que gastou dinheiro na conservao sofre desvantagem no mercado, pois ela precisa ser mais cara (ou ganhar menos margem) para recuperar o investimento na conservao. O nico que leva vantagem o caador de rinocerontes, que os mata e vende seus chifres.

Nunca. Ele teria criado e protegido esses animais de

forma a possuir um estoque sempre para suprir o mercado. Isso no tem nada a ver com autrusmo, tem a ver com

Isso bastante deprimente. Mas a Economia pode oferecer ao menos alguns insights sobre como os rinocerontes pretos e outras espcies podem ser salvas. Uma estratgia de conservao eficiente poderia ser alinhar corretamente os incentivos das pessoas que moram perto do habitat natural dos rinocerontes. Explicando: fornea as pessoas locais alguma razo para elas quererem os animais vivos no lugar de mortos. Essa a premissa na indstria nascente de eco-turismo. Se turistas ficarem dispostos a pagar bastante dinheiro para estacionar e fotografar os rinocerontes e, mais importante, se a populao local de alguma forma se beneficiar de um lucro dividido deste turismo, dai ela ter grande incentivo para mant-los vivos. Isso funcionou em locais como Costa Rica, um pas que protegeu suas florestas ao estabelecer mais de 25% do pas como um parque nacional. O turismo gera US$ 1 bilho em receita anual, representando 11% do PIB.

[1] Naked Economics, de Charles Wheelan, 2002, W.W.Norton, pgina 23

Dilemas Sociais
Em certo sentido, todos os dilemas abaixo so o mesmo dilema. A cooperao produziria melhor resultado a todos, mas a soluo cooperativa no um equilbrio de Nash e h pelo menos um equilbrio de Nash no cooperativo apenas esperando para nos atrair para a armadilha. O Dilema dos Prisioneiros apenas um dos muitos dilemas sociais que nos deparamos nas tentativas de cooperar. Sete destes dilemas so particularmente prejudiciais, e "tericos dos jogos" tm dado um nome diferente bem evocativo para cada um. Alm do Dilema dos Prisioneiros, os outros seis so os seguintes: - A Tragdia dos Comuns, que logicamente equivalente a uma srie de Dilemas do Prisioneiros jogados entre vrias pessoas em um grupo. - O Free Rider (uma variante da Tragdia dos Comuns), que surge quando as pessoas se beneficiam de um recurso da comunidade sem contribuir para isso. - O Covarde [Chicken] (tambm conhecido como Brinkmanship), em que cada um tenta empurrar um ao outro perto do limite, e cada um espera que o outro vai desistir primeiro. Ele pode surgir em diversas situaes, desde algum que tenta empurrar o outro numa linha de trfego at os confrontos entre naes que poderiam levar guerra. - O Dilema do Voluntrio, em que algum deve fazer um sacrifcio em nome do grupo, mas se ningum o fizer, ento todo mundo sai perdendo. Cada pessoa espera que algum v ser o nico a fazer o sacrifcio, o que poderia ser to trivial como fazer um esforo para colocar o lixo para fora ou dramtico como sacrificar sua vida para salvar outros. - A Batalha dos Sexos, em que duas pessoas tm preferncias diferentes, como um marido que quer ir ao futebol enquanto a mulher prefere ir ao cinema. O dilema ou compartilhar a companhia do outro ou seguir a prpria preferncia sozinho. - A Caa ao Veado (Stag Hunt), em que a cooperao entre os membros de um grupo daria uma boa chance de sucesso em um empreendimento arriscado de alto retorno, mas um indivduo pode ganhar uma recompensa garantida, mas inferior, se romper a cooperao e ir sozinho.

Esta uma traduo livre da pgina 55 do livro Rock, Paper, Scissors - Game Theory in Everyday Life, de Len Fisher.