Vous êtes sur la page 1sur 36

Mathématiques

et
Théorie des Jeux
Qu’est ce que la Théorie des jeux ?
• Une théorie mathématique
du conflit et de la coopération . . .

• Elle analyse des situations où des agents


rationnels doivent prendre des décisions
stratégiques dont les conséquences dépendent
de l’état du monde,
mais aussi des décisions prises par les autres
agents.
• Des motivations historiques et philosophiques
anciennes :
La question du contrat social chez les précurseurs de la
philosophie politique,
Platon (La république, - 427, -347),
Hobbes (Le Léviathan, 1651),
Rousseau (Du Contrat Social, 1762).
• Des motivations historiques et philosophiques
anciennes :
La question du contrat social chez les précurseurs de la
philosophie politique,
Platon (La république, - 427, -347),
Hobbes (Le Léviathan, 1651),
Rousseau (Du Contrat Social, 1762).

• Une théorie jeune :


Von Neumann et Morgenstern
(Theory of Games and Economic Behavior, 1944 ).
Qu’est ce qu’un jeu ?
• Des joueurs : i = 1, 2

• Un ensemble d’actions pour chaque joueur :


A1, A2

• Des fonctions d’utilité : U1, U2 :A1 × A2→ R


U1(x,y) = utilité (payoff) du joueur 1 associée aux
actions x et y.

 Les joueurs jouent simultanément.


Le Dilemme du Prisonnier
(Tucker, 1950)
Trahir Coopérer
-6 /-6 0 /-10
T

C -10 / 0 -2 /-2
Le DP est un paradigme pour de nombreuses
situations :
• Le Problème du « free rider » (les boites à
journaux en Suisse)
• La provision des biens publics (environnement,
taxes, défense nationale,…)

La solution de Hobbes : Changer les règles du


jeu …
« Covenants struck without the sword are but
words », 1651, Le Léviathan
Le Dilemme du Prisonnier
Équilibres
Un couple d’actions (x , y) est un équilibre de
Nash si

U2 (x , y) ≥ U2(x , y) pour toute action y


et
U1 (x , y) ≥ U1(x , y) pour toute action x
Un couple d’actions (x , y) est un équilibre de
Nash si

U2 (x , y) ≥ U2(x , y) pour toute action y


et
U1 (x , y) ≥ U1(x , y) pour toute action x

• (T,T) est l’unique équilibre du Dilemme du


Prisonnier
Le jeu des 3 ponts
Sûr Pierres Cobras
0 / 100 100 / 0 100 / 0
S
80 / 20 0 / 100 80 / 20
P
60 / 40 60 / 40 0 / 100

C
• Le jeu des 3 ponts n’admet pas d’équilibre…

Et pourtant :
Théorème (Nash, 1950) : Tout jeu admet un équilibre
en stratégies mixtes

« I certainly knew right away that it was a thesis. I


didn’t know it was a Nobel. » (David Gale, 1995)
• Une stratégie mixte est une « loterie » (une
distribution de probabilité) sur l’ensemble des
actions
• L’utilité s’étend par bilinéarité à l’espace des
stratégies mixtes
U(x,y) = Σ x(i) y(j) U(i,j)
 L’équilibre dans le jeu des 3 ponts est
x ~ (0.26, 0.32, 0.42), y ~ (0.49, 0.36, 0.15)
La valeur du jeu~ 51
L’existence n’est pas l’unicité
Le jeu du Cerf et du Lièvre
“S’agissait-il de prendre un cerf, chacun sentait
bien qu’il devait pour cela garder fidèlement son
poste; mais si un lièvre venait à passer à la portée
de l’un d’eux, il ne faut pas douter qu’il ne le
poursuivit sans scrupule, et qu’ayant atteint sa
proie il ne souciât fort peu de faire manquer la
leur à ses compagnons”
Rousseau, Discours sur l’origine de l’inégalité, 1755
Cerf Lièvre
5/5 0/4
C

4/0 2/2
L
Cerf Lièvre
5/5 0/4
C Pareto dominant

4/0 2/2
L
Cerf Lièvre
5/5 0/4
C Pareto dominant

4/0 2/2
L Risque dominant
(Harsanyi et Selten,
prix Nobels 1994)
Cerf Lièvre
5/5 0/4
C Pareto dominant

4/0 2/2
L Un équilibre mixte : Risque dominant
(2/3 C, 1/3 L) (Harsanyi et Selten,
prix Nobels 1994)
• La multiplicité des équilibres,
• La question de la rationalité et du « common
knowledge »,
• Les évidences expérimentales,

Posent un Problème Majeur à la théorie des


jeux classique :
• La multiplicité des équilibres,
• La question de la rationalité et du « common
knowledge »,
• Les évidences expérimentales,

Posent un Problème Majeur à la théorie des


jeux classique :
Pourquoi les joueurs devraient t-ils se
coordonner sur un équilibre particulier ?
Apprentissage et Dynamique
Une explication alternative issue de l’économie et
de la biologie évolutionnaire est que

« les équilibres peuvent résulter d’un processus


dynamique d’adaptation ou d’apprentissage »
Une explication alternative issue de l’économie et
de la biologie évolutionnaire est que

« les équilibres peuvent résulter d’un processus


dynamique d’adaptation ou d’apprentissage »

Maynard Smith, Evolution and the Theory of Games,


1982,
Fudenberg et Levine, Theory of Learning in Games,
1998,
Le processus de meilleure réponse
• y(n) = fréquence empirique des actions du
joueur 2 à l’instant n,

• br(y(n)) = « la meilleure réponse à y(n) »


= Argmax {j : U1( j, y(n))},

• À l’instant n+1, le joueur 1 joue l’action br(y(n))


avec une probabilité proche de 1 et le joueur 2
en fait autant …
 Vieille idée (Robinson, 1950) revisitée à la
lumière de la théorie des systèmes dynamiques, des
processus stochastiques, des inclusions et des équations
différentielles

 Travaux en collaboration avec


o M. W Hirsch, Berkeley
o J. Hofbauer, Londre et Vienne
o S. Sorin, Paris
o J. Weibull, Stockholm
Jeux à somme nulle
• U1(x,y) + U2(x,y) = c

Théorème : Pour un jeu à somme nulle (x(n),y(n))


converge presque sûrement vers l’équilibre de Nash.
Jeux à 2 joueurs et 2 stratégies
Théorème : Pour un jeu 2 × 2 (x(n),y(n)) converge
presque sûrement vers un équilibre de Nash.

« Génériquement » un jeu 2 × 2 admet un ou trois


équilibres : 2 purs et 1 mixte.
Dans le second cas (x(n),y(n)) converge presque sûrement
vers un équilibre pur et chaque équilibre pur a
une probabilité positive d’être sélectionné.
Externalités de Réseau

Cerf Lièvre
5/5 0/4
C

4/0 2/2
L
Externalités de Réseau

Betamax Vhs
5/5 0/1
B

1/0 2/2
V
Externalités de Réseau

Ideal Qwerty
5/5 0/1
I

1/0 2/2
Q
Jeux M x N où M>2, N > 2

• Analyse locale : Tout équilibre stable (instable) a


une probabilité positive (nulle) d’être
sélectionné.
• Analyse globale : l’asymptotique du jeu requiert
l’analyse globale d’un système dynamique non
linéaire.
Convergence, Oscillation et Chaos sont possibles.
Jeux répétés et Coordination

Vous aimerez peut-être aussi