Vous êtes sur la page 1sur 17

Universidade do Rio Grande do Sul

Faculdade de Economia, Contabilidade e Atuariais


Departamento de Economia

Giordano Bressan Ribeiro

DESIGN DE MECANISMOS E ECONOMICA COMPORTAMENTAL

Orientador: Sabino da Silva Pôrto Júnior

2018
1. Introdução

A economia comportamental, em tempo recente, vem se mostrando um campo de


pesquisa incrivelmente promissor. Richard Thaler, ganhador do prêmio Nobel de
Economia de 2017, foi responsável por desenvolver uma grande quantidade de aplicações
na área, os quais ele chamou de “empurrões” (Nudges). Esses gestos seriam capazes de
permitir uma mudança de atitude significativa a um custo extremamente baixo.

Os exemplos são inúmeros e dos mais variados, desde reorganizar a ordem da


comida em um buffet na tentativa de melhorar a saúde das pessoas até padronizar as
escolhas do sistema de saúde norte americano. Suas ideias foram tão bem aceitas que o
governo britânico criou a chamada Nudge Unit, na tentativa de aplicar essas ideias a
sociedade inglesa. No front teórico, a notoriedade deriva dos resultados conjuntos obtidos
através da interdisciplinariedade entre economia e psicologia, uma parceria que gerou um
maior entendimento do comportamento individual e coletivo nas decisões econômicas,
como os conceitos de Aversão a Perda, Framming e uma discussão no campo da
teorização sobre felicidade.

Juntamente a esses resultados a economia comportamental vem tentando


solucionar situações mal-resolvidas quanto ao modo como os indivíduos interagem, e o
presente trabalho, nesse contexto, vem a somar-se a literatura existente, dentro do
contexto de teoria dos jogos. Mais especificamente, quando tratamos de certos tipos de
jogos, que apresentam soluções controversas e que desafiam não apenas o senso comum,
mas especialmente o corpo teórica existente, sendo o mais comum nessa categoria, o Jogo
da Centopeia.

O escopo, a partir da descrição anterior, é tentar determinar se os indivíduos, ao


se depararem com a forma abstrata (estrutura dinâmica) do jogo da centopeia, apresentam
comportamento consistente com os axiomas da racionalidade estabelecidas pelo
mainstream econômico (completeza, transitividade e reflexividade). Desse forma, se a
versão axiomática se mostrar insuficiente para explicar a ação humana, então fica
evidente que outros fatores devem ser incorporados para explicar seus movimentos.

De modo geral, como já analisado por Aumman (1992) e McKelvey e Palfrey


(1992), de maneira geral, os indivíduos, em muito, desviam do resultado estabelecido pela
teoria mainstream, uma vez que não se conformam ao equilíbrio predito para o jogo
(Equilíbrio de Nash). Por outro lado, como mostra Palacios-Huerta e Volij (2009) em seu
controverso artigo, grupos seletos de jogadores podem adequar-se quase que
perfeitamente a predição feita pela teoria econômica. Portanto o objetivo principal é
verificar, em uma população estudantil, qual o comportamento que ela toma ao ser
apresentada a tal jogo. Como a experimentação será realizada com estudantes a primeira
hipótese é de que a conformação dificilmente acontecerá, a excessão, talvez, de estudantes
que conheçam a intuição do jogo da centopeia (ainda que no artigo de McKelvey e Palfrey
a mera existência de indivíduos chamados “altruistas” tornava muito mais vantajoso para
os participantes continuar jogando, quando comparado a parar logo no início).

Como esse jogo possui diversas interpretações, e constitui uma das anomalias na
área de teoria dos jogos, e na própria teoria mainstream, com forte documentação por
teóricos de economia comportamental, a natureza do estudo se mostra grandemente
relevante, na tentativa de entender, de que modo os seres humanos (em contraposição os
Econs, como descritos por Thaler) efetivamente se comportam, ou ainda melhor, como
eles não se comportam.

Além disso, com a crescente popularidade de Economia Comportamental e a


proliferação cada vez maior de estudos a essa respeito permitem desenvolver, com maior
respaldo na literatura, um tema que ainda se mostra muito espinhoso não apenas para
economistas, mas para todo o conjunto da economia. Dessa forma, assim como Kennedy,
em seu discuros de 1960, temos que perceber que uma nova fronteira está no horizonte,
quer a procuremos ou não, e ela requer toda a criatividade, inventividade e imaginação
que possamos ter. Somente assim faremos avançar o cinturão de conhecimento que
possuímos, legado de eras e eras de conhecimento, e estaremos, efetivamente, fazendo
ciência.
2. Revisão Bibliográfica

Em meio a vasta literatura pertinente a teoria dos jogos, a quantidade de artigos


que tratam a respeito não apenas dos paradoxos, mas também das discrepâncias entre
argumentos teóricos e experiências empíricas ocupa uma área de destaque. A sequência
de estudos perpassa inicialmente as ideias introduzidas por Selten (1974) quando discorre
a respeito do chamado “Chain Store Paradox”, e ganha ainda mais importância com a
análise experimental do Dilema do Prisioneiro Finito, ambas visando mostrar que o
modelo estático e rígido do Equilíbrio de Nash, ainda que um marco fundamental e a base
para o desenvolvimento de teoria dos jogos, precisa se reanalisado a luz das evidências
empíricas e das próprias intuições teóricas.

De modo ainda mais particular, diversos autores se debruçaram sobre o jogo da


centopéia, outro pequeno tesouro do conjunto de paradoxos de teoria dos jogos (Goeree
and Holt (2001): Ten Little Treasures of Game Theory), por seu caráter pouco intuitivo,
pela dissociação entre teoria e prática e por causa da uma extensa discussão, entre linhas
teóricas distintas, a respeito do significado do fracasso do sistema preditivo convencional
e seus refinamentos.

O jogo da centopéia foi introduzido primeiramente por Rosenthal (1981), e


amplamente estudado por Aumann (1992, 1995), Binmore (1996) e diversos outros
pesquisadores. Em sua forma mais conhecida, dois jogadores competem em um jogo
extensivo (dinâmico) de informação completa e perfeita escolhendo entre duas pilhas de
dinheiro que crescem exponencialmente, sendo a pilha maior sempre pertencente ao
jogador que realiza a ação. No primeiro nódulo o jogador 1 escolhe entre a estratégia
Tomar (T) a pilha, o que termina o jogo, com cada jogadores recebendo seu payoff
respectivo, ou Passar (P) a decisão para o outro jogador, o que faz com que a escolha das
pilhas seja deixada a cargo do jogador 2. O processo é iterado um número finito de vezes
até que algum dos jogadores escolha T ou, no último nódulo, o jogador escolha P.

A ideia central desse jogo está na forma como é elaborado. Dada a estrutura do
jogo e dos payoffs, o equilíbrio de Nash (assim como diversos outros refinamentos:
Fairness Equilibrium, Equitative Equilibrium...) apresenta como predição a jogada de T
no primeiro nódulo. Nesse caso o conceito de racionalidade, a ideia de que é necessário
conhecimento comum de racionalidade, torna o mecanismo preditivo ainda mais
restritivo uma vez que nenhuma probabilidade positiva pode ser atribuida a qualquer outra
estratégia no jogo.

Nesse contexto, diversos experimentos foram realizados na tentativa de esclarecer


a efetividade da predição e no caso de falha, quais as possíveis explicações e ramificações
desse evento para teoria dos jogos. O primeiro experimento nessa linha é aquele realizado
por McKelvey e Palfrey (1992) com estudantes da Calthec (California Institute of
Technology). Nesse estudo são analisados os principais hipóteses de racionalidade e da
possilibidade de aprendizado entre jogos. Seu conceito experimental está em distribuir
pessoas em dois grupos (no estudo chamados Azuis e Vermelhos) e fazer com que cada
pessoas do time azul jogue com cada indivíduo do time vermelho, totalizando dez jogos
por pessoas e cem jogos no total, em quatro sessões.

A hipótese adotada por McKelvey e Palfrey (que será explorado pelos autores
subsequentes, já que existem poucos estudos a esse respeito, e portanto, muito diálogo
entre os estudos) é de que, em primeiro lugar o jogo da centopéia é estruturado pelos
jogadores como possuindo informação incompleta. Existiriam dois tipos, distribuidos
pela natureza na jogada zero, os altruístas (aqueles que sempre jogam P) e os não-
altruístas (ou egoístas, definidos residualmente como aqueles que não satisfazem a
definição de altruísta). De maneira ainda mais peculiar, os dados são analisados sob a
ótica do modelo de Equilíbrio de Resposta Quântico, que prevê a possibilidade de
ocorrerem erros nas ações dos indivíduos e em suas crenças (indivíduos menos
sofisticados).

A utilização do modelo permitiu que as probabilidades inferidas teoreticamente


em muito se assemelhassem as probabilidades verificadas empiricamente. Um dos
grandes problemas destacados no texto, em compensação, é a ideia de que a mímica que
indivíduos do tipo egoísta realizariam em relação a tipos altruístas somente ocorreria
mediante uma porcentagem bastante alta de tais indivíduos, o que não foi verificado. Em
especial, em Fey et al. (1994) um artigo que analisa jogos da centopeia de soma constante,
artigo em que McKelvey e Palfrey contribuiram, a explicação através do tipo altruísta é
rejeitada, uma vez que é “(...) implausible here because altruistic behavior does not imply
that a subject should ever pass.” Em compensação é evidenciado novamente que o
modelo de Equilíbrio de Resposta Quântico é o que melhor se conforma as dados, não
apenas como preditor do jogo, mas também do movimento de aprendizado do jogadores
sessão após sessão.
Posterior aos artigos citados, é introduzida a ideia de analisar a forma normal e
não a forma extensiva do jogo da centopeia (é importante notar que todo jogo extensivo
possui uma forma normal única, mas o contrário não é verdadeiro) no artigo de Nagel e
Tang (1998). Novamente procura-se entender o comportamento paradoxal na preferência
dos indivíduos de escolher estratégias não correspondentes ao equilíbrio e sua capacidade
de aprendizado no entre sessões. Nesse experimente, que segue, em linhas gerais, a ideia
do experimento de McKelvey e Palfrey, são testados diversos modelos de aprendizado,
como o modelo Quântico, e o modelo de Jogadas Fictícias (Fictitious Play).

De maneira geral, as conclusão são de em algum modo discrepantes da obtidas


pelos outros trabalhos acadêmicos. Primeiramente, o modelo Quântico, assim como o
Equilíbrio de Nash e o modelo de Jogadas Fictícias, apresentam uma performance inferior
a modelos simples de reforço (reinforcement). Mais interessantemente, o caráter de
aprendizado retratado nos outros artigos não aparece nesse tratamento do jogo da
centopeia. Em grande parte existe maior volatilidade de jogadas, até que, em sessões
posteriores, surge uma tendência a manter o comportamente estável, mas não no sentido
de convergir para o Equilíbrio de Nash, como explicitado por Zauner (1999). O modelo
simples não é capaz de explicitar certos caracteres do jogo, como a transição de
comportamento entre P e T, sem afetar grandemente a robustez dos resultados obtidos.

À luz dos trabalhos anteriores, um estudo que causou bastante furor no meio
acadêmico, não tanto pelo modo como foi formulado mas por seus resultados, foi o
realizado por Palacius-Huerta e Volij (2009) intitulado Field Centipede. Nesse modelo de
experimento (chamado pelos pesquisadores norte americanos de artefactual experiment)
os pesquisadores escolheram enxadristas, como o grupo a ser observado, na tentativa de
demonstrar que, para pessoas habituadas a realizar indução retroativa no xadrez (um jogo
que implica uma capacidade cognitiva alta), é possível fazer a transferência desse
conhecimento para o contexto de teoria dos jogos.

Como no primeiro artigo, Palacius-Huerta e Volij utilizam um jogo da centopeia


de seis movimentos (três para cada jogador) com a mesma estrutura de payoff que
McKelvey e Palfrey, ou seja crescendo exponencialmente de modo que a pilha grande
sempre pertence ao jogador que se movimenta. Os enxadristas foram escolhidos conforme
sua classificação no ranking mundial, de modo que Grão-Mestres corresponde a
classificação mais alta, seguida de Mestres Internacionais, Mestres Federativos e por fim
jogadores com uma pontuação no sistema de classificação (Elo) maior que 2000 pontos.
À parte dos jogadores de xadrez foram incorporados ao experimento também alunos de
graduação da Universidad del País Vasco na Espanha como tratamento base.

Os achados mais interessantes concernem a probabilidade condicional (Pi) dos


jogadores em jogar D em determinado nódulo i, caso o nódulo i tenha sido alcançado. Em
primeiro lugar quando estudantes jogavam com outros estudantes a probabilidade, que de
certa forma explicita um índice de convergência ao Equilíbrio de Nash, foi de apenas 5%.
Quando estudantes e enxadristas jogavam, como jogador um e jogador dois
respectivamente, essa probabilidade aumentava para 47%, e no caso inverso (enxadrista
como jogadores um e estudantes, dois) o valor se aproximava de 60%. Por fim, a
conclusão mais estarrecedora é a de que, quando jogadores de xadrez competiam no jogo
da centopeia a correspondência entre a jogada efetiva e a predição dos modelos teóricos
era completa, ou seja, 100% dos jogadores convergiam para o Equilíbrio ao jogar T no
primeiro nódulo.

Frente a esses achados surge a possibilidade de que cognição limitada e


aprendizado são dois fatores fundamentais, tanto nas aplicações a jogos quanto na
resolução de paradoxos presentes na literatura. Nesse caso, a resultado se estende apenas
ao jogo da centopeia em sua forma extensiva, mas não deixa de ser menos impressionante.

Subsequente ao artigo anterior é o apresentado por Levitt et al. (2011) que tenta
reproduzir o experimento de Palacius-Huerta e Volij, mas também inclui outros
experimentos e considerações. Diferentemente da análise dos autores espanhois, Levitt,
List e Sadoff desenvolvem um método experimental que envolve dúplice tratamento: o
jogo da centopeia em sua construção inicial (a mesma adotada por Palacius-Huerta) assim
como a mesma estrutura de payoffs e um outro jogo chamado corrida aos 100, em dois
tratamentos: o primeiro de 1-9, e o segundo de 1-10. No jogo corrida aos 100, no primeiro
tratamento por exemplo, os jogadores, em sequência, falam números de um à nove e
aquele que chegar a cem ganha (É importante ressaltar que cada jogo discutivo no artigo
possui uma única resposta por indução retroativa).

A metodologia para o primeiro jogo segue de maneira bastante atenta as


especificações propostas por Volij, assim como os indivíduos que participam da
experiência, com a única exceção que a esse conjunto de pessoas, também são incluidos
alguns enxadristas que possuem pontuação no Ranking Elo inferior a 2000 pontos (outra
diferença fundamental entre os estudos é de que, nesse, os participantes não eram
informados contra quem estavam jogando, enquanto naquele alunos e jogadores de xadrez
eram distinguidos).

Ao apresentar os dados, a análise estatística permitiu a verificação de fatos bem


definidos que posteriormente os autores tentarão incorporar ao modelo de especificação
do jogo. Em primeiro lugar a probabilidade condicional de jogar T (como definida
anteriormente) apresentou tendência crescente ao longo de cada nódulo alcançado. Dessa
forma é notável que os jogadores não conformaram suas jogadas a previsão teórica
estabelecida pelo Equilíbrio de Nash e mais do que isso, nenhum Grão-Mestre ou Mestre
Internacional jogou T no primeiro nódulo, esse resultado entrando em franco conflito com
o artigo de Palacious-Huerta e Volij. Além disso, convergência ao equilíbrio foi da ordem
de 3,9%.

Quando se tratou do do jogo corrida aos 100, os resultados correspondentes a


utilização de indução retroativa foi mais encorajador. No tratamento de 1-9 logo na
primeira jogada 57,3% dos indivíduos já haviam resolvido o problema, enquanto no
segundo tratamento de 1-10, a quantidade é significantemente reduzida para 12,6%
(possível consequência do fato de que os “números-chave” que correspondem ao
resultado por indução no primeiro caso são mais intuitivos que no segundo, reforçando a
ideia de que mudanças pouco significativas podem influenciar o método de resolução
Binmore et al. (2002)).

Talvez de maneira abismal, o resultado obtido entre os jogos é de que os


enxadristas que, em grande parte, resolveram com facilidade o jogo da centopeia tiveram
maior dificuldade no corrida aos 100 e vice-versa, acusando a possibilidade de
transferência imperfeita ou mesmo a incapacidade de transferir os conhecimentos de
indução retroativa do xadrez para diversas classes de jogos. Não apenas isso, mas pode
existir uma característica de reciprocidade entre indivíduos, o que, de certa forma, remete
a ideia do tipo altruísta, apresentada pro McKelvey e Plafrey, ainda que o jogo, nesse
caso, seja visualizado como de informação perfeita e completa.

Outro fator interessante que o artigo traz a tona, como crítica ao modelo de
pesquisa no jogo da centopeia é a ideia da quantidade de repetições apresentada pelos
artigos. Seja em Rapoport et al. (2003) ou mesmo em Fey et al. (1994) em que são
repetidos, os experimentos, 60 e 100 vezes respectivamente, argumenta o autor que a
quantidade é excessiva, uma vez que situações de interação estratégica, na vida cotidiana
são poucas, como comprar um casa, fechar um grande negócio, ou ainda mesmo escolher
um plano de aposentadoria para o futuro.

Outros dois artigos assumem caráter extremamente relevante na literatura a


respeito do jogo da centopeia. O primeiro deles é o estudo realizado por Rapoport et al.
(2003) que subverte uma grande quantidade de ideias já propriamente assentadas em
outros experimentos. As mudanças principais realizadas estão relacionadas a quantidade
de jogadores (três ao invés de dois) assim como um valor para os payoff bastante alto (o
conceito chamado high stakes).

Desse modo, é apresentado um jogo com nove nódulos, em que cada jogador
possui três jogadas ao longo de toda a sequência de movimentos. A estrutura dos payoffs
em muito se assemelha com as desenvolvidas por McKelvey e Palfrey, com as excessões
de que a diferença do valor dos payoff e entre os payoffs do jogadores e bastante alto e o
fato de que, no último nódulo, ao invés da ação P auferir a quem a joga o ótimo de Pareto
do jogo, os payoffs são zero para todos os jogadores.

O método consiste em separar 60 indivíduos em quatro grupos, cada grupo


realizando 60 rounds do jogo, sendo utilizado um processo randômico de seleção do
oponente de cada jogador, para impedir a construção de alguma forma de reputação.

Quando analisadas as estatísticas do experimento, algumas características tornam-


se salientes: A frequência com que a estratégia de equilíbrio foi jogada, em cada uma das
quatro sessões, foi de 46,3%, 39,3%, 30,3% e 40,7% resultados quantitativamente mais
significantes que aqueles obtidos em praticamente todos os outros estudos (a exceção de
Palacius-Huerta e Volij (2009)). Além disso, as frequências de jogada, em cada nódulo,
apresentam comportamente monotônico decrescente, em contraste com McKelvey e
Palfrey.

Outros pontos focais foram de que alguns indivíduos forma capazes de alcançar o
o payoff maximo mais frequentemente do que os outros e o fato de que, como discorrido
por Aumann (1974), em experimentos que envolvam jogos sequenciais existe uma
característica, nos jogadores, de Dependência Sequencial, ou seja, quanto mais distante
do primeiro nódulo, maior a probabilidade do jogador um jogar P no próximo round.

Em grande medida, a utilização dos modelos mais comuns, nesses dados não
forneceu nenhuma contribuição para seu entendimento, em especial o próprio equilíbrio
de Nash forneceu indicações contraditórias a experiência empírica. O próprio modelo
Quântico também não obteve grande sucesso com os dados. Uma das possíveis
explicações apresentadas pelos autores é a de que pelo fato de haver diferenças
significativas nos experimentos os dados não correspondem (mais do que isso, a definição
de tipos altruístas não pode ser utilizado dada a estrutura de payoffs do jogo). Partem, os
autores, para modelos de aprendizado individual, que são capazes de melhor capturar as
propriedades dessas informações.

Em conclusão Rapoport explica grande parte das descobertas, em especial, da


conformação a predição, como uma maior dificuldade em relações triádicas, em oposição
a relações diádicas, o valor substancialmente maior dos payoffs, a capacidade de
aprendizado dos indivíduos e o caráter randômico da seleção de oponentes. Sob essas
condições parece haver maior convergência mas é necessário considerar que 60% das
estratégias ainda não conforma com o resultado do preditor teórico.

O segundo artigo nessa classe de jogos é o introduzido por Zauner (1999) que
possibilita a interpretação de que jogadores, ao implementarem suas estratégias, jogam
com algum erro, mais particularmente, os payoffs individuais são aditivamente e
independentemente perturbados, e a medida que o jogo é repetido o erro é reduzido, muito
similar a ideia do aprendizado de Rapoport e Nagel e Tang.

Algumas ressalvas devem ser incorporadas a análise da literatura referente a esse


jogo paradoxal. Ainda que outros artigos também adotem a ideia de informação
incompleta e tipos, para explicar os resultados (Kreps e Wilson (1982), Milgrow e Roberts
(1982)), essa ideia não é padronizada, de maneira que conparação entre trabalhos
acadêmicos é fortemente prejudicada. Somado a isso, parece existir uma variação muito
grande entre os dados obtidos nos diferentes estudos, caracterizando o que alguns
estudiosos chamam de Noisy Play, ou seja, por vezes os indivíduos jogam sem qualquer
perspectiva, ou mehor ainda, aleatoriamente, de modo que captar suas ações através de
um único modelo é inviável.

É nessa linha que alguns artigos que estão em produção (working papers)
passaram a incorporar, além do equilíbrio de Nash clássico e do modelo de equilíbrio de
resposta quântico o modelo de hierarquia cognitiva (CH), que, além de melhor incorporar
os dados também é capaz de dar conta de relações triádicas. Aliado a isso, a explicação
de certos comportamentos através de “other regarding preferences” tem ganhado força,
na medida, não apenas tem surgida na literatura teórica, mas já era visível na literatura
experimental a preferência de certos indivíduos pelo payoff material de outros juntamente
com o seu próprio (como é o caso em que indivíduos demonstram aversão à
desigualdade).

É nessa contexto que, aliada a vasta crítica feita por estudiosos de teoria dos jogos,
surge como grande desafiante os teóricos da economia comportamental. Na tentativa de
explicar diversos fenômenos atípicos nesse ramo da microeconomia, muito utilizam do
arcabouço de psicologia para tentar distinguir fenômenos puramente econômicos de
fenômenos psicológicos e como esses se mesclam de modo formar a estrutura social em
que vivemos. É através desse esforço interdisciplinar que diversos paradoxos podem ser
esclarecidos, em especial a o dilema do prisionero finito e o jogo da centopeia que por
tantos anos tem se mostrado um empecilho na formação de um corpo teórico unido,
fechado e coerente.

Com o recente Nobel da Economia sendo recebido por Richard Thaler, não há
duvida de que mais e mais teremos que trabalhar em conjunto com diversas outras
disciplinas, deixando de lado hipóteses incongruentes e aliando a nosso arcabouço novos
conceitos. Somente procurando observar como o ser humano se comporta poderemos
obter predições mais certeiras a respeito da grande construção social que chamamos de
economia e desse modo, assim como um biólogo que observa uma colméia ou um
formigueiro para entender o comportamento de seus indivíduos, poderemos captar em sua
total magnitude o crescer e desenvolver das diversas sociedades que permeiam o planeta
e a forma como interagem entre si.
3. Metodologia

Quanto ao processo metodológico a ideia inicial corresponde a realizar um


experimento, reproduzindo a tentativa de McKelvey e Palfrey (1992). Dessa forma, serão
necessários cinquenta indivíduos, divididos em dois grupos, um de cor Vermelha e outro
Azul (nome dos grupos meramente como identificador).

Uma vez divididos em dois grupos, serão eles novamente subdivididos em cinco
grupos, cada um contendo cinco participantes do time vermelho e cinco do time azul. E
a partir dessa subdivisão cada indivíduo (seja ele do time azul ou vermelho) jogará com
todos os indivíduos do time adversário, pertencentes ao subgrupo o qual faz parte. Dessa
forma cada jogador fará cinco partidas, sendo que, em cada subgrupo, ao todo, serão
jogados cinquenta partidas. Na experimentação como um todo o número de partidas será
de duzentas e cinquenta, de modo que seja possível, através de uma população
razoavelmente grande, realizar inferências estatísticas com a maior precisão possível.

O método como será realizado o experimento, ainda que tentando seguir fielmente
o proposto no artigo acadêmico de 1992, diferirá em alguns quesitos devido em especial
a estrutura da universidade e da verba disponível. Em primeiro lugar, enquanto no artigo
a realização do experimento ocorreu em terminais de computador, em laboratórios
específicos, de maneira a manter o anonimato entre jogadores, acredita-se que, nesse
trabalho, terá de ser realizado com ambos os jogadores presentes no mesmo recinto, já
que a utilização de equipamento específico está além das possibilidades do autor.

Além disso, um dos fatores, talvez, de maior importância, assim como assinalado
por Rapoport (2003), corresponde ao recebimento de payoff, e não apenas quaisquer
valores, mas payoff altos (os chamados high stakes). Segundo Rapoport, a utilização de
payoffs altos proporciona diferenciação no resultado, ainda que não distorçam
grandemente as conclusões mesmo para valores significativamente altos. Como a verba
utilizada é restritiva e muito escassa, os valores oferecidos (assim que sancionados pelo
comitê de ética) serão baixos, ou talvez nulos.

Por fim, uma característica diferente entre as duas pesquisas será a utilização de
apenas estudantes, já que são a população com maior disponibilidade dentro das
oportunidades disponíveis dentro da universidade.
Tendo assentado a fundação da estrutura do experimento, passemos ao jogo
propriamente dito. Novamente, assim como McKelvey e Palfrey, a ideia é utilizar um
jogo da centopeia de 4 nódulos e outro de 6 nódulos, para possibilitar o estudo de
diferenciação de tamanho entre os casos. Dessa forma, o primeiro jogo possuirá dois
participantes que jogam sequencialemente (cada jogador possui até duas jogadas,
dependendo da distância que o jogo alcançar) e apresentará duas ações disponíveis, passar
(P) ou tomar (T). No primeiro nódulo, o jogador um escolhe entre P e T: se escolher P o
jogo continua e o jogador dois é responsável pela próxima ação, enquanto se o jogador
um escolher T, ambos os jogadores recebem o payoff correspondente ao nódulo em que
estão e o jogo acaba. Os payoffs estão estruturados ao longo do jogo de modo a crescerem
exponencialmente a partir de R$ 0,40 e R$ 0,10 (para o jogador um e jogador dois
respectivamente).

Quando se trata do jogo com seis nódulos os elementos não mudam, apenas os
participantes passam a ter um maior número de possíveis jogados, três nesse caso, e
payoffs maiores, uma vez que sua estrutura também cresce exponencialmente ao longo
dos nódulos. Assim como no jogo anterior, o último nódulo comporta a decisão de T ou
P, sendo que ambos possuem payoffs positivos, diferente da experimentação de Rapoport
em que passar no último nódulo dava aos jogadores payoff zero.

Dado o formato do experimento, a evidência coletada a partir daí será analisada a


partir dos modelos teóricos de predição de equilíbrio padrões como o equilíbrio de Nash,
o mecanismo de eliminação iterada de estratégias dominadas, assim como uma série de
modelos na fronteira do conhecimento, como os modelos de resposta quantal e modelos
de aprendizado simples, capazes de incorporar uma variável temporal intersessões
capturando o entendimento dos jogadores em relação ao experimento.
4. Esquema Provisório

1. Introdução
2. Revisão Bibliográfica
3. Experimento e Metodologia
4. Resultados do Experimento
5. Modelagem
6. Conclusão
5. Cronograma de Execução

Não há ainda definições de datas, apenas uma estimativa de como serão


processados os passos para finalizar o projeto de conclusão de curso. Pelo fato de que
muitas das decisões não dependem do autor, então é possível que as previsões realizadas
não sejam representativas das datas efetivas em que elas aconteçam.

A princípio a realização do experimento (ainda que subordinada a aprovação do


comitê de ética) deve começar a ser realizada no começo do primeiro semestre de 2019,
possivelmente março ou abril. Se tudo correr bem, o experimento será realizado nos
meses referidos e já teremos os dados para começar a desenvolver a parte teórica.

Uma vez com os dados em mãos, o período subsequente será utilizada para
averiguar os dados coletados e analisá-los através dos instrumentos comentados na parte
de metodologia. Em princípio, a organização dos dados, a verificação, e sua utilização
nos modelos quantal e de aprendizado devem tomar alguns os alguns meses (incluindo
também relatar os resultados).

A formatação, revisão e entrega constituirão a última etapa do projeto e


possivelmente, se todos os outros passos correrem como esperado, a conclusão do
trabalho ocorrerá no final do primeiro semestre de 2019.

Dezembro - 2018 Finalização do Pré - Projeto


Março/Abril - 2019 Início do Experimento
Período de Maio até Agosto - 2019 Análise dos dados e criação do texto
Setembro – 2019 Revisão e formatação
Novembro/ Dezembro - 2019 Entrega e Defesa do TCC
6. Referências Bibliográficas:
Aumann, R. Subjectivity and correlation in randomized strategies, Journal of
Mathematical Economics, 1, (1), 67-96. (1974).
Aumann, R. Irrationality in Game Theory. In: Dasgupta, P., et al., Eds., Economic
Analysis of Markets and Games: Essays in Honor of Frank Hahn, MIT Press, Cambridge and
London, 214-227. (1992)
Aumann, R., Backward induction and common knowledge of rationality, Games and
Economic Behavior, 8, (1), 6-19. (1995)
Binmore, K., Rubinstein, A. and Wolinsky, A. The Nash Bargaining Solution in
Economic Modelling, RAND Journal of Economics, 17, (2), 176-188. (1986).
Binmore, K., McCarthy J., Ponti, G., Samuelson, L. and Shaked, A. A Backward
Induction Experiment, Journal of Economic Theory, 104, (1), 48-88. (2002).
Fey, M., McKelvey, R. and Palfrey, T. An Experimental Study of Constant-Sum
Centipede Games, International Journal of Game Theory, 25, (3), 269-87. (1996).
Goeree, J. and Holt, C. Ten Little Treasures of Game Theory and Ten Intuitive
Contradictions, American Economic Review, 91, (5), 1402-1422. (2001).
Kreps, D. and Wilson R. Reputation and imperfect information, Journal of Economic
Theory, 27, (2), 253-279. (1982).
Levitt, S., List, J. and Sadoff, S. E. Checkmate: Exploring Backward Induction among
Chess Players, American Economic Review, 101, (2), 975-90. (2011).
McKelvey, R. and Palfrey, T. An Experimental Study of the Centipede
Game, Econometrica, 60, (4), 803-36. (1992).
Milgrom, P. and Roberts, J. Limit Pricing and Entry under Incomplete Information: An
Equilibrium Analysis, Econometrica, 50, (2), 443-59. (1982).
Nagel, R. and Tang, F. F. Experimental results on the centipede game in normal form: an
investigation on learning. Journal of Mathmatical Psychology 42(2-3): 356-84. (1998).
Palacios-Huerta, I. and Volij O. Field Centipedes, American Economic Review, 99, (4),
1619-35. (2009).
Rapoport, A., Stein W. E., Parco J. and Nicholas T. E. Equilibrium play and adaptive
learning in a three-person centipede game, Games and Economic Behavior, 43, (2), 239-265.
(2003).
Rosenthal, R. Games of perfect information, predatory pricing and the chain-store
paradox, Journal of Economic Theory, 25, (1), 92-100. (1981).

Selten, R. The Chain Store Paradox, No 018, Center for Mathematical Economics
Working Papers, Center for Mathematical Economics, Bielefeld University. (1974).
Zauner, K. G. A payoff uncertainty explanation of results in experimental centipede
games. Games and Economic Behavior 26(1): 157-85. (1999).

Vous aimerez peut-être aussi