Académique Documents
Professionnel Documents
Culture Documents
2018
1. Introdução
Como esse jogo possui diversas interpretações, e constitui uma das anomalias na
área de teoria dos jogos, e na própria teoria mainstream, com forte documentação por
teóricos de economia comportamental, a natureza do estudo se mostra grandemente
relevante, na tentativa de entender, de que modo os seres humanos (em contraposição os
Econs, como descritos por Thaler) efetivamente se comportam, ou ainda melhor, como
eles não se comportam.
A ideia central desse jogo está na forma como é elaborado. Dada a estrutura do
jogo e dos payoffs, o equilíbrio de Nash (assim como diversos outros refinamentos:
Fairness Equilibrium, Equitative Equilibrium...) apresenta como predição a jogada de T
no primeiro nódulo. Nesse caso o conceito de racionalidade, a ideia de que é necessário
conhecimento comum de racionalidade, torna o mecanismo preditivo ainda mais
restritivo uma vez que nenhuma probabilidade positiva pode ser atribuida a qualquer outra
estratégia no jogo.
A hipótese adotada por McKelvey e Palfrey (que será explorado pelos autores
subsequentes, já que existem poucos estudos a esse respeito, e portanto, muito diálogo
entre os estudos) é de que, em primeiro lugar o jogo da centopéia é estruturado pelos
jogadores como possuindo informação incompleta. Existiriam dois tipos, distribuidos
pela natureza na jogada zero, os altruístas (aqueles que sempre jogam P) e os não-
altruístas (ou egoístas, definidos residualmente como aqueles que não satisfazem a
definição de altruísta). De maneira ainda mais peculiar, os dados são analisados sob a
ótica do modelo de Equilíbrio de Resposta Quântico, que prevê a possibilidade de
ocorrerem erros nas ações dos indivíduos e em suas crenças (indivíduos menos
sofisticados).
À luz dos trabalhos anteriores, um estudo que causou bastante furor no meio
acadêmico, não tanto pelo modo como foi formulado mas por seus resultados, foi o
realizado por Palacius-Huerta e Volij (2009) intitulado Field Centipede. Nesse modelo de
experimento (chamado pelos pesquisadores norte americanos de artefactual experiment)
os pesquisadores escolheram enxadristas, como o grupo a ser observado, na tentativa de
demonstrar que, para pessoas habituadas a realizar indução retroativa no xadrez (um jogo
que implica uma capacidade cognitiva alta), é possível fazer a transferência desse
conhecimento para o contexto de teoria dos jogos.
Subsequente ao artigo anterior é o apresentado por Levitt et al. (2011) que tenta
reproduzir o experimento de Palacius-Huerta e Volij, mas também inclui outros
experimentos e considerações. Diferentemente da análise dos autores espanhois, Levitt,
List e Sadoff desenvolvem um método experimental que envolve dúplice tratamento: o
jogo da centopeia em sua construção inicial (a mesma adotada por Palacius-Huerta) assim
como a mesma estrutura de payoffs e um outro jogo chamado corrida aos 100, em dois
tratamentos: o primeiro de 1-9, e o segundo de 1-10. No jogo corrida aos 100, no primeiro
tratamento por exemplo, os jogadores, em sequência, falam números de um à nove e
aquele que chegar a cem ganha (É importante ressaltar que cada jogo discutivo no artigo
possui uma única resposta por indução retroativa).
Outro fator interessante que o artigo traz a tona, como crítica ao modelo de
pesquisa no jogo da centopeia é a ideia da quantidade de repetições apresentada pelos
artigos. Seja em Rapoport et al. (2003) ou mesmo em Fey et al. (1994) em que são
repetidos, os experimentos, 60 e 100 vezes respectivamente, argumenta o autor que a
quantidade é excessiva, uma vez que situações de interação estratégica, na vida cotidiana
são poucas, como comprar um casa, fechar um grande negócio, ou ainda mesmo escolher
um plano de aposentadoria para o futuro.
Desse modo, é apresentado um jogo com nove nódulos, em que cada jogador
possui três jogadas ao longo de toda a sequência de movimentos. A estrutura dos payoffs
em muito se assemelha com as desenvolvidas por McKelvey e Palfrey, com as excessões
de que a diferença do valor dos payoff e entre os payoffs do jogadores e bastante alto e o
fato de que, no último nódulo, ao invés da ação P auferir a quem a joga o ótimo de Pareto
do jogo, os payoffs são zero para todos os jogadores.
Outros pontos focais foram de que alguns indivíduos forma capazes de alcançar o
o payoff maximo mais frequentemente do que os outros e o fato de que, como discorrido
por Aumann (1974), em experimentos que envolvam jogos sequenciais existe uma
característica, nos jogadores, de Dependência Sequencial, ou seja, quanto mais distante
do primeiro nódulo, maior a probabilidade do jogador um jogar P no próximo round.
Em grande medida, a utilização dos modelos mais comuns, nesses dados não
forneceu nenhuma contribuição para seu entendimento, em especial o próprio equilíbrio
de Nash forneceu indicações contraditórias a experiência empírica. O próprio modelo
Quântico também não obteve grande sucesso com os dados. Uma das possíveis
explicações apresentadas pelos autores é a de que pelo fato de haver diferenças
significativas nos experimentos os dados não correspondem (mais do que isso, a definição
de tipos altruístas não pode ser utilizado dada a estrutura de payoffs do jogo). Partem, os
autores, para modelos de aprendizado individual, que são capazes de melhor capturar as
propriedades dessas informações.
O segundo artigo nessa classe de jogos é o introduzido por Zauner (1999) que
possibilita a interpretação de que jogadores, ao implementarem suas estratégias, jogam
com algum erro, mais particularmente, os payoffs individuais são aditivamente e
independentemente perturbados, e a medida que o jogo é repetido o erro é reduzido, muito
similar a ideia do aprendizado de Rapoport e Nagel e Tang.
É nessa linha que alguns artigos que estão em produção (working papers)
passaram a incorporar, além do equilíbrio de Nash clássico e do modelo de equilíbrio de
resposta quântico o modelo de hierarquia cognitiva (CH), que, além de melhor incorporar
os dados também é capaz de dar conta de relações triádicas. Aliado a isso, a explicação
de certos comportamentos através de “other regarding preferences” tem ganhado força,
na medida, não apenas tem surgida na literatura teórica, mas já era visível na literatura
experimental a preferência de certos indivíduos pelo payoff material de outros juntamente
com o seu próprio (como é o caso em que indivíduos demonstram aversão à
desigualdade).
É nessa contexto que, aliada a vasta crítica feita por estudiosos de teoria dos jogos,
surge como grande desafiante os teóricos da economia comportamental. Na tentativa de
explicar diversos fenômenos atípicos nesse ramo da microeconomia, muito utilizam do
arcabouço de psicologia para tentar distinguir fenômenos puramente econômicos de
fenômenos psicológicos e como esses se mesclam de modo formar a estrutura social em
que vivemos. É através desse esforço interdisciplinar que diversos paradoxos podem ser
esclarecidos, em especial a o dilema do prisionero finito e o jogo da centopeia que por
tantos anos tem se mostrado um empecilho na formação de um corpo teórico unido,
fechado e coerente.
Com o recente Nobel da Economia sendo recebido por Richard Thaler, não há
duvida de que mais e mais teremos que trabalhar em conjunto com diversas outras
disciplinas, deixando de lado hipóteses incongruentes e aliando a nosso arcabouço novos
conceitos. Somente procurando observar como o ser humano se comporta poderemos
obter predições mais certeiras a respeito da grande construção social que chamamos de
economia e desse modo, assim como um biólogo que observa uma colméia ou um
formigueiro para entender o comportamento de seus indivíduos, poderemos captar em sua
total magnitude o crescer e desenvolver das diversas sociedades que permeiam o planeta
e a forma como interagem entre si.
3. Metodologia
Uma vez divididos em dois grupos, serão eles novamente subdivididos em cinco
grupos, cada um contendo cinco participantes do time vermelho e cinco do time azul. E
a partir dessa subdivisão cada indivíduo (seja ele do time azul ou vermelho) jogará com
todos os indivíduos do time adversário, pertencentes ao subgrupo o qual faz parte. Dessa
forma cada jogador fará cinco partidas, sendo que, em cada subgrupo, ao todo, serão
jogados cinquenta partidas. Na experimentação como um todo o número de partidas será
de duzentas e cinquenta, de modo que seja possível, através de uma população
razoavelmente grande, realizar inferências estatísticas com a maior precisão possível.
O método como será realizado o experimento, ainda que tentando seguir fielmente
o proposto no artigo acadêmico de 1992, diferirá em alguns quesitos devido em especial
a estrutura da universidade e da verba disponível. Em primeiro lugar, enquanto no artigo
a realização do experimento ocorreu em terminais de computador, em laboratórios
específicos, de maneira a manter o anonimato entre jogadores, acredita-se que, nesse
trabalho, terá de ser realizado com ambos os jogadores presentes no mesmo recinto, já
que a utilização de equipamento específico está além das possibilidades do autor.
Além disso, um dos fatores, talvez, de maior importância, assim como assinalado
por Rapoport (2003), corresponde ao recebimento de payoff, e não apenas quaisquer
valores, mas payoff altos (os chamados high stakes). Segundo Rapoport, a utilização de
payoffs altos proporciona diferenciação no resultado, ainda que não distorçam
grandemente as conclusões mesmo para valores significativamente altos. Como a verba
utilizada é restritiva e muito escassa, os valores oferecidos (assim que sancionados pelo
comitê de ética) serão baixos, ou talvez nulos.
Por fim, uma característica diferente entre as duas pesquisas será a utilização de
apenas estudantes, já que são a população com maior disponibilidade dentro das
oportunidades disponíveis dentro da universidade.
Tendo assentado a fundação da estrutura do experimento, passemos ao jogo
propriamente dito. Novamente, assim como McKelvey e Palfrey, a ideia é utilizar um
jogo da centopeia de 4 nódulos e outro de 6 nódulos, para possibilitar o estudo de
diferenciação de tamanho entre os casos. Dessa forma, o primeiro jogo possuirá dois
participantes que jogam sequencialemente (cada jogador possui até duas jogadas,
dependendo da distância que o jogo alcançar) e apresentará duas ações disponíveis, passar
(P) ou tomar (T). No primeiro nódulo, o jogador um escolhe entre P e T: se escolher P o
jogo continua e o jogador dois é responsável pela próxima ação, enquanto se o jogador
um escolher T, ambos os jogadores recebem o payoff correspondente ao nódulo em que
estão e o jogo acaba. Os payoffs estão estruturados ao longo do jogo de modo a crescerem
exponencialmente a partir de R$ 0,40 e R$ 0,10 (para o jogador um e jogador dois
respectivamente).
Quando se trata do jogo com seis nódulos os elementos não mudam, apenas os
participantes passam a ter um maior número de possíveis jogados, três nesse caso, e
payoffs maiores, uma vez que sua estrutura também cresce exponencialmente ao longo
dos nódulos. Assim como no jogo anterior, o último nódulo comporta a decisão de T ou
P, sendo que ambos possuem payoffs positivos, diferente da experimentação de Rapoport
em que passar no último nódulo dava aos jogadores payoff zero.
1. Introdução
2. Revisão Bibliográfica
3. Experimento e Metodologia
4. Resultados do Experimento
5. Modelagem
6. Conclusão
5. Cronograma de Execução
Uma vez com os dados em mãos, o período subsequente será utilizada para
averiguar os dados coletados e analisá-los através dos instrumentos comentados na parte
de metodologia. Em princípio, a organização dos dados, a verificação, e sua utilização
nos modelos quantal e de aprendizado devem tomar alguns os alguns meses (incluindo
também relatar os resultados).
Selten, R. The Chain Store Paradox, No 018, Center for Mathematical Economics
Working Papers, Center for Mathematical Economics, Bielefeld University. (1974).
Zauner, K. G. A payoff uncertainty explanation of results in experimental centipede
games. Games and Economic Behavior 26(1): 157-85. (1999).