Vous êtes sur la page 1sur 15

Chapitre 6 : Introduction à la théorie des jeux

I. Introduction
Dans la vie de tous les jours, des preneurs de décisions (hommes politiques, consommateurs,
producteurs, comités d’entreprise, traders, citoyens) ont à faire un choix parmi plusieurs
actions possibles.
Dans un grand nombre de problèmes décisionnels, au moins quelques aspects parmi les
suivants sont présents :
• il y a au moins deux preneurs de décision;
• il y a une interaction entre les décisions dans le sens où l’issue finale pour un des preneurs
de décision dépend non seulement de l’action qu’il a choisie mais aussi des actions choisies
par d’autres décideurs;
• il y a un ou plusieurs éléments d’incertitude.
Il est facile de citer plusieurs exemples des problèmes caractérisés par les aspects présentés ci-
dessus. Pour modéliser et analyser ces problèmes, on peut utiliser ce qu’on appelle la théorie
des jeux.
II. Définitions
Théorie des jeux
- La théorie des jeux est un formalisme qui vise à étudier les interactions entre agents
sachant que de telles interactions peuvent s’étendre de la coopération au conflit.
- La théorie des jeux est la discipline mathématique qui étudie les situations où le sort
de chaque participant dépend non seulement des décisions qu’il prend mais également
des décisions prises par d’autres participants.
- La théorie des jeux est un champ des mathématiques qui a pour objet d’établir et
d’étudier les principes et les règles mathématiques pouvant intervenir dans l’analyse
des différents types de comportement et des issues possibles lors d’une interaction
stratégique entre plusieurs preneurs de décisions (appelés agents en économie et
joueurs en théorie des jeux). Un des buts de la théorie des jeux est d’abord de créer des
modèles mathématiques de base. Ces modèles essaient de synthétiser tous les éléments
essentiels pour décrire l’interaction, puis d’introduire des concepts de solution pour
décrire les issues possibles d’un jeu, et enfin, d’appliquer ces outils pour mieux
comprendre les phénomènes (sociaux,..) mais aussi pour prédire les conséquences
d’une interaction stratégique.

1
Un jeu : un jeu est une situation où des individus (les joueurs ) sont conduits à faire des
choix parmi un certain nombre d'actions possibles, et dans un cadre défini à l'avance (les
règles du jeu), le résultat de ces choix constituant une issue du jeu, à laquelle est associée un
gain, positif ou négatif, pour chacun des participants.
On peut cependant ajouter que les intérêts des joueurs sont souvent différents, et même
opposés dans de nombreux cas, ce qui permet de considérer les jeux, ou en tout cas certains
d'entre eux, comme les modèles les plus simples de situation de conflits d'intérêts.
Nous avons donc un certain nombre d'éléments qui composent un jeu :
- les joueurs ;
- les actions et stratégies des joueurs ;
- le déroulement et les étapes du jeu ;
- les résultats du jeu ;
- les informations dont disposent les joueurs lors de chaque choix d'action.

Règles d’un jeu : Les règles d'un jeu indiquent :


1. la succession des étapes du jeu, et l'ordre dans lequel interviennent les joueurs ;
2. les actions qui sont autorisées à chaque étape ;
3. les informations dont dispose le joueur chaque fois qu'il doit prendre une décision.
Stratégie : Une stratégie en théorie des jeux est un plan d'action complet spécifiant ce
que le joueur fera à chaque étape de décision et face à chacune des situations pouvant survenir
au cours du jeu.
On dit que les actions disponibles pour chacun des joueurs sont des stratégies
Une issue du jeu est une combinaison de stratégies à raison d’une stratégie par joueur.

2
Une stratégie pure est une action, ou un plan d’actions, qui est choisie par chaque joueur avec
certitude.
Utilité : On appelle utilité la mesure de chaque situation aux yeux de l'agent. L'utilité
n'est ni une mesure du gain matériel, monétaire, etc. mais une mesure subjective du
contentement de l'agent.
Equilibre : L’équilibre d’un jeu est le choix par chaque agent de sa stratégie optimale. Les
états dans lesquels aucun joueur ne souhaite modifier son comportement compte tenu du
comportement des autres.
III. Domaines d’application
Chaque situation décrite ici, fait appel à un modèle, un type de comportement et une solution
adéquats.
Economie
• dans un marché : le prix d’un bien dépend des décisions de tous les intervenants
(pouvoirs public, producteurs, consommateurs) ;
• en situation d’oligopole : à une demande fixée des consommateurs, ce sont les
choix de tous les producteurs en compétition qui vont déterminer le prix d’un bien ;
• le marchandage entre acheteur et vendeur ;
• dans une enchère publique ou privée : l’issue (i.e. l’agent qui a obtenu l’objet et le
prix qu’il a payé pour l’acquérir) est déterminée par les actions de tous les
enchérisseurs, et aussi par le type d’enchère utilisée par l’organisateur.
Science Politique et Relations Internationales
• la compétition électorale entre les candidats pour les différents postes;
• La compétition entre les partis politiques pour gagner les élections;
• le vote législatif, le vote pour une politique extérieure ou une politique économique;
• la négociation entre pays afin d’établir des accords internationaux: cessation des
hostilités, traités de désarmement, accords économiques et commerciaux...
Droit
• La compétition entre le défendeur et la partie adverse: comment construire son
dossier, à quels moments faut-il révéler un argument, quels sont les faits qu’il faut
cacher et ceux qu’il faut dévoiler, comment induire l’autre partie en erreur et
comment utiliser l’argument de l’autre contre lui mais aussi faire attention à ne pas
utiliser un argument qui risque de se retourner contre soi...

3
• Quand une loi doit être adoptée, il faut analyser toutes les possibilités d’utilisation
de cette loi et les différentes conséquences de chaque utilisation.
Biologie
...
IV. Classification des jeux
La théorie des jeux classifie les jeux en catégories en fonction de leurs approches de
résolution. Les catégories les plus ordinaires sont :
Jeux à information parfaite / Jeux à information imparfaite
On parle de jeu à information parfaite dans le cas de jeu sous forme extensive (voir la section
suivante), où chaque joueur a une connaissance parfaite de toute l'histoire du jeu. Dans le cas
contraire le jeu est dit à information imparfaite
Jeux à deux joueurs / Jeux à n joueurs :
Deux ou n joueurs.
Un jeu est à information complète
Un jeu est à information complète quand chaque joueur connaît l'ensemble des composantes
du jeu, et à information incomplète sinon.
Jeux coopératifs et jeux non coopératifs
Dans les jeux coopératifs, on étudie la formation de coalitions entre les joueurs afin d’obtenir
de meilleurs résultats pour leurs membres.
Jeux simultanés et jeux séquentiels
Dans un jeu simultané, les joueurs décident en même temps de leur stratégie. Au contraire,
dans un jeu séquentiel, on peut spécifier l'ordre des décisions de sorte qu'un joueur peut
décider de sa stratégie conditionnellement à ce qu'ont joué les autres joueurs précédemment.
Jeux finis
On dit qu'un jeu est fini lorsque l'ensemble des stratégies de chacun des joueurs est fini.
Jeux à somme nulle et jeux à somme non nulle
On appelle jeu à somme nulle ou jeu strictement compétitif, les jeux à deux joueurs dans
lesquels l'intérêt de l'un des deux joueurs est strictement opposé à l'intérêt de l'autre joueur. Si
les préférences des joueurs sont représentées par une fonction de gain ou une fonction
d'utilité, alors la somme des deux fonctions est toujours égale à 0.
Les échecs par exemple sont des jeux à somme nulle car les gains de l’un sont très exactement
les pertes de l’autre.
Jeux répétés

4
La répétition d’un jeu, avec connaissance des résultats intermédiaires, change souvent
fondamentalement son déroulement (les meilleurs coups et la conclusion).
Par exemple, il peut être utile de prendre ponctuellement le risque de perdre « pour voir »,
tester les autres joueurs, et mettre en place des stratégies de communication par les coups
joués (à défaut d’autre moyen de communication).
Il se développe également des phénomènes de réputation qui vont influencer les choix
stratégiques des autres joueurs.
Jeu à information complète/incomplète
On dit qu'un jeu est à information complète si chaque joueur connaît lors de la prise de
décision :
• ses possibilités d'action
• les possibilités d'action des autres joueurs
• les gains résultants de ces actions
• les motivations des autres joueurs
Les jeux en information incomplète sont des situations où l'une des conditions n'est pas
vérifiée. Ce peut être parce qu'une des motivations d'un acteur est cachée (domaine important
pour l'application de la théorie des jeux à l'économie).
V. Représentations des jeux
Un jeu est défini par l'ensemble des joueurs, l'ensemble des stratégies possibles pour chacun
des joueurs et la spécification des gains ou des utilités des joueurs pour chaque combinaison
de stratégies. On a deux représentations possibles : forme normale (stratégique) et forme
extensive.
a. Forme normale (Stratégique)
Un jeu sous forme normale (ou jeu sous forme stratégique) est défini par :
• l'ensemble des joueurs,
• l'ensemble des stratégies possibles pour chacun des joueurs,
• les préférences de chacun des joueurs sur l'ensemble des combinaisons stratégiques
possibles.
Les préférences peuvent aussi être représentées par une fonction d'utilité ou une fonction de
gain. L'ensemble des joueurs doit être fini. L'ensemble des stratégies de chacun des joueurs
peut être fini,

5
Matrice des gains
Il s'agit d'un tableau à double-entrée qui énumère sur chaque côté les stratégies possibles des
joueurs respectifs. Dans la case à la croisée de deux stratégies, on note le couple de gains des
deux joueurs.
Remarque : Si le jeu est à somme nulle et à deux joueurs, alors on peut ne noter que les gains
du premier joueur : ceux du second sont directement opposés.

Exemple de matrice des gains

b. Forme extensive
Dans tous les jeux, les décisions peuvent être représentées par un arbre, dont chaque nœud est
associé au joueur qui décide. Chaque option constitue une branche. Les gains de tous sont
associés aux terminaisons ou feuilles de l'arbre. Un joueur n’a toutefois pas besoin de savoir
comment il est parvenu à un nœud : seul compte l'état présent du jeu, et les positions
recherchées dans le futur. Lorsque certains mouvements ne sont autorisés qu’après un
événement donné, cet événement n’est qu’un des éléments à matérialiser dans l’état présent
du jeu et n'a pas besoin de faire partie d'un historique.

c. Relation entre forme extensive et forme stratégique


- A chaque jeu sous forme extensive correspond un jeu sous forme stratégique dans lequel les
joueurs choisissent simultanément les stratégies qu’ils mettront en œuvre.
- En revanche, un jeu sous forme stratégique peut correspondre à plusieurs jeux sous forme
extensive différents.

6
VI. Exemple : Pierre/Ciseaux/Papier
On prend l'exemple : Pierre, Ciseaux, Papier.
Règles du jeu :
Dans ce jeu, appelons-le PCP, deux joueurs, J1 et J2, s'affrontent. Ils doivent
simultanément choisir un élément parmi les trois suivants : Pierre, Ciseaux, Papier
S'ils choisissent le même élément, la partie est nulle, sinon on considère que :
- le papier enveloppe la pierre, et le joueur ayant choisi le papier gagne la partie ;
- les ciseaux découpent le papier, et le joueur ayant choisi les ciseaux gagne la
partie ;
- la pierre détruit les ciseaux, et le joueur ayant choisi la pierre gagne la partie.
Stratégie
Dans le jeu qui nous intéresse, chaque joueur peut donc jouer en choisissant une stratégie
parmi les trois suivantes :
- prendre la pierre ;
- prendre les ciseaux ;
- prendre la feuille de papier.
Chaque joueur connaît les choix qu'il peut effectuer, les choix que son adversaire peut
faire, ainsi que le résultat dans chacune des issues possibles : on dit alors que le jeu est
à information complète.
L'intérêt de J1 est complètement opposé à celui de J2 : on dit que le jeu est
strictement compétitif.

7
Dans ce cas particulier la somme des utilités est toujours égale à zéro quel que soit
l'issue : on dit que le jeu est à somme nulle.
Représentation extensive
On peut alors représenter les différentes parties possibles grâce à un arbre comme
celui de la figure suivante :

Forme extensive du jeu Pierre/Ciseaux/Papier

- La racine de l'arbre correspond au coup du joueur J1.


- Trois arcs, correspondant aux trois éléments que ce joueur peut choisir de
prendre, en sont issus.
- Ces arcs rejoignent des nœuds, représentant les coups possibles du joueur J2.
De chacun de ces nœuds, trois nouveaux arcs rejoignent une feuille particulière de
l'arbre, correspondant à un résultat du jeu, que l'on nomme communément une
partie.
Sur chaque arc est noté l'élément choisi par le joueur situé en amont de l'arc.
- Il y a autant de parties possibles que de feuilles à l'arbre. A chaque partie est
associée une issue, qui est en fait un vecteur des utilités, encore appelées gains ou
paiements, de chacun des joueurs.
- Dans le cas de la figure 1.1, ces vecteurs donnent en première coordonnée le
gain du joueur J1, et en seconde coordonnées le gain du joueur J2. Un gain de 1
signifie que le joueur a gagné, un gain de -1 signifie que le joueur a perdu, et un
gain de 0 signifie que la partie est nulle.
Cette représentation est appelée la forme extensive, ou encore la forme développée
du jeu PCP.

8
Pour faire apparaître la simultanéité du jeu sur la représentation, on a entouré les
ensembles d'informations. J2 sait que J1 a choisi un élément, mais il ne sait pas
lequel, donc il ne connaît pas le nœud exact où son propre choix va intervenir, et
donc il est incapable de déterminer l'issue du jeu qui va être atteinte. Le jeu est dit à
information imparfaite.
Représentation stratégique
On peut également représenter ce même jeu par un tableau à double entrées, comme celui
de le tableau suivant

Forme stratégique du jeu Pierre/Ciseaux/Papier

- Chaque ligne du tableau représente une des stratégies que le joueur J1 peut suivre, et
chaque colonne représente une de celles que le joueur J2 peut utiliser. Les cases du
tableau correspondent alors à un résultat du jeu, et on y inscrit l'issue associée, avec la
même convention sur l'ordre des coordonnées que précédemment.
- Cette représentation, via une matrice de vecteur de paiements, est nommée la forme
stratégique, ou encore la forme normale du jeu PCP. On dira également que la matrice
représentée par le tableau précédent est la matrice de gains de PCP.
- Le jeu que l'on vient de décrire est un jeu dont le déroulement ne comporte qu'une
étape : le choix simultané d'un objet par les joueurs. Un jeu peut cependant comporter
un nombre quelconque d'étapes, ce qui complexifie son étude du jeu, ne serait-ce que
par le nombre de stratégies alors disponible.

9
VIII. Exemples de jeux
VIII.1. Dilemme du prisonnier
Dans ce jeux, on suppose que deux suspects sont interrogés séparément par la police pour une
action délictueuse grave. La police ne dispose pas d’éléments de preuve suffisants pour
obtenir la condamnation des prévenus pour l’acte dont ils sont accusés. L’aveu d’au moins
l’un des deux est donc indispensable.
La police propose à chaque accusé d’avouer, dans quel cas il sera relâché. S’il n’avoue pas
mais que l’autre le fait, il écope d’une peine de prison de 15 ans. Si les deux avouent, ils
peuvent espérer bénéficier de circonstances atténuantes et recevoir une peine de 8 ans chacun.
Enfin, si aucun des deux n’avoue, ils seront condamnés pour des délits mineurs à 1 an de
prison. La matrice des gains a donc la forme suivante.

On remarque immédiatement que


- Avouer constitue une stratégie qui conduit toujours à une peine moins lourde que Ne
pas avouer, et ce quel que soit le choix effectué par l’autre. Dès lors, il semble naturel
de penser que chacun des prévenus va choisir cette stratégie dans l’intention de réduire
sa peine. Le résultat est qu’ils vont tous les deux être condamné à 8 ans de prison, ce
qui constitue malgré tout `a une condamnation assez lourde. Dans ce jeu, la stratégie
Avouer est “optimale” puisque, si l’importance de la condamnation dépend du
comportement de l’autre prévenu, chaque joueur peut prendre sa décision sans avoir
besoin de se faire une idée de ce que va faire l’autre. Dans le dilemme du prisonnier,
Avouer est une stratégie dominante pour les deux prévenus.
VIII.2. Bataille des sexes
Supposons que deux personnes (joueurs) (J1) et (J2) aillent au cinéma. Une fois sur place, ils
doivent choisir entre aller voir un documentaire ou une comédie. L'un des deux préfère les
documentaires et l'autre les comédies, mais tous deux préfèrent voir un film ensemble que
séparément.
Les stratégies disponibles pour chacun des deux joueurs, en considérant qu'ils font leur choix
simultanément , sont alors :
- Aller voir un documentaire, on notera Doc.
10
- Aller voir une comédie, on notera Com.
On peut alors représenter cette situation de confits d'intérêts par le jeu dont le tableau suivant
représente la forme stratégique. Les gains de chaque joueur représentent le niveau de plaisir
atteint par le joueur

- Un sous-jeu est simplement un sous-arbre de l'arbre de jeu.

VIII.3. Concours de beauté


N joueurs doivent annoncer un nombre entre 0 et K. Le vainqueur est celui qui annonce le
nombre le plus près de p fois la moyenne des annonces avec p un nombre entre 0 et 1.
VIII.4. Jeu de l'ultimatum
Le jeu de l'ultimatum modélise un problème simple de négociation sous forme séquentielle.
Deux individus doivent se partager une certaine somme d'argent, 10 euros par exemple. Tout
d'abord, le premier joueur propose un partage (x, 10-x), c'est-à-dire qu'il annonce au deuxième
joueur qu'il veut garder x euros et qu'il lui donne le reste. Puis, le deuxième joueur peut soit
valider ce partage, soit y renoncer et dans ce cas, les deux joueurs n'ont rien et les 10 euros
sont perdus.
En général le premier joueur propose la moitié des gains au second joueur.

11
VII. Quelques méthodes de Résolution
La résolution d'un jeu correspond à la recherche d'une issue et d'une combinaison stratégique
qui permettent aux joueurs de maximiser leur utilité, ce qui correspond à une certaine forme
de rationalité pour les joueurs. On considèrera donc qu'être rational pour un joueur, c'est le
fait de préférer entre deux issues celle qui offre la plus grande utilité.
a. Elimination successive des stratégies dominées.
Considérons le jeu suivant (on va appeler le joueur I le joueur ligne et le joueur II le joueur
colonne).

Comparons les stratégies M et R pour le joueur colonne. On observe que:


• Si le joueur ligne joue T, la stratégie M donne au joueur colonne 2 alors que R donne
seulement 1.
• Si le joueur ligne joue B alors, la stratégie M donne au joueur colonne 1 alors que la stratégie
R donne seulement 0.
Et donc, indépendamment de ce que fait le joueur ligne, la stratégie M donne strictement plus
au joueur colonne que la stratégie R.
Stratégie strictement dominée

Stratégie faiblement dominée

12
- Si si est strictement dominée par ti alors, face à n’importe quelle stratégie des autres
joueurs, en jouant ti le joueur i gagne strictement plus que ce qu’il aurait gagné en jouant si.
Il parait donc naturel et logique de supposer qu’un joueur rationnel (cherchant à maximiser
son utilité), ne va jamais jouer une stratégie strictement dominée.
Exemple

Stratégies strictement dominées


- Dans la nouvelle situation, la stratégie B est strictement dominée par T. Ainsi, B peut
être éliminée. On obtient donc le nouveau jeu réduit suivant:

- Dans ce cas, L peut être éliminée. Ceci nous amène à un jeu où chaque joueur possède
une unique stratégie: pour le joueur ligne T et pour le joueur colonne M avec (1, 2)
comme paiement.
Ce procédé est appelé procédé d’élimination des stratégies strictement dominées. Quand
ce procédé converge vers un unique résultat, on qualifie ce résultat comme étant la
solution du jeu et on dit que le jeu est résoluble par dominance.
b. Équilibre en stratégies dominantes
Un jeu possède un équilibre en stratégies (strictement) dominantes si pour chacun des joueurs,
il existe une stratégie qui domine toutes ses autres stratégies, quelles que soient les stratégies
des autres joueurs.
Autrement dit, quelles que soient les stratégies des autres joueurs, le paiement que j'obtiens en
jouant cette stratégie dominante sera strictement supérieur à celui obtenu en jouant une autre
stratégie.

13
Chaque joueur jouera donc évidemment sa stratégie dominante et personne n'aura intérêt à
dévier de cet équilibre.
Exemple
Si dans un jeu donné tous les joueurs disposent d’une stratégie dominante et qu’ils choisissent
effectivement cette stratégie, le résultat du jeu est appelé équilibre en stratégies dominantes.
Dans le dilemme du prisonnier, le couple (Avouer,Avouer) est un équilibre en stratégies
dominantes.

c. Équilibre de Nash
Une stratégie pure du joueur i est un plan d'action qui prescrit une action de ce joueur pour
chaque fois qu'il est susceptible de jouer.
Un équilibre de Nash est une situation telle qu'aucun joueur n'a intérêt à dévier (seul)
unilatéralement de sa stratégie.
Pour les jeux finis, c'est-à-dire les jeux pour lesquels l'ensemble des stratégies de chacun des
joueurs est fini, on distingue l'équilibre de Nash en stratégies pures et l'équilibre de Nash en
stratégies mixtes :
- Un équilibre de Nash en stratégies pures est l'équilibre d'un jeu dans lequel les joueurs
choisissent une stratégie de manière déterministe
- l'équilibre de Nash en stratégie mixte est l'équilibre de l'extension mixte de ce jeu,
c'est-à-dire du même jeu, dans lequel les joueurs choisissent de jouer les différentes
stratégies possibles de manière probabiliste. Leur stratégie est alors définie par le
vecteur de probabilités qu'ils associent à chacune des stratégies pures possibles.
- tout jeu fini a au moins un équilibre de Nash en stratégies mixtes. En revanche, rien ne
garantit que l'équilibre de Nash soit unique.
Un équilibre de Nash est un profil de stratégies tel que la stratégie de chaque joueur est
une réponse optimale aux stratégies des autres joueurs.
- L'équilibre en stratégie dominante est donc un équilibre de Nash. Lorsqu'il existe (ce
qui est assez rare), l'équilibre en stratégie dominante est unique.
- Un jeu peut avoir plusieurs équilibre de Nash pure ou ne peut n’en avoir aucun ;
- Une stratégie strictement dominée ne peut jamais être présente dans un équilibre de
Nash en stratégies pures ;
- Si l’élimination des stratégies strictement dominées donne un seul résultat, ce dernier
est l’unique équilibre de Nash pure du jeu.

14
- Un des problèmes inhérents au concept d’équilibre de Nash en stratégies pures est que
pour certains jeux, de tels équilibres n’existent pas.
Exemples
Exemple1
Dans le jeu suivant:

(M,R) est l’unique équilibre de Nash.


Pourquoi (B,L) n’est pas un équilibre de Nash ?
Fixons la colonne L (choix de joueur colonne), les choix T,M (pour le joueur ligne) sont
inférieur aux choix B (3<6,4<6).Mais, en fixant la ligne B (choix de joueur ligne), la valeur de
L est inférieur à la valeur de B (5<7), donc le joueur colonne peut changer son choix seul en
augmentant son gain, donc (B,L) n’est pas un équilibre de Nash.
Exemple2
Dans le jeu de coordination suivant:

(T,L) et (B,R) sont tous les deux des équilibres de Nash.


Exemple3
L’exemple le jeu de ”Pierre, Papier, Ciseaux” :

N’admet pas d’équilibre de Nash.

15

Vous aimerez peut-être aussi